Esto es un post que admito copiado de la web, pero me parecio interesante y lo quiero esparcir aun mas aqui el link:
http://ronronia.blogspot.com.ar/2011/12/deep-web-la-web-invisible-el-inframundo.html

Antes les dejo un video en que en el minuto trece dross explica muy bien el tema:

link: http://www.youtube.com/watch?v=Ychm-SpvH3M&feature=BFa&list=HL1335913629


Y aca el blog que les mencione:

Como bien explican en Neoteo en los dos artículos que os voy a poner al final, decir que NAVEGAMOS por la red es extrañamente preclaro porque lo cierto es que nos desplazamos por la superficie sin darnos cuenta de que debajo existen profundidades abisales de cuyo tamaño y contenido no somos conscientes. NO SABEMOS BUCEAR por esas profundidades que probablemente almacenen más del 96% de todo lo guardado en la red. 


La web oculta, The Deep Web.
La red que conocemos y por la que navegamos es como esa masa visible del iceberg que es tan sólo la punta de una enorme masa, mucho mayor, que se oculta en los oscuros abismos del fondo marino.


webImagen y artículo en JEP
Así que vamos navegando por nuestro barquito, echando la red de nuestros buscadores tradicionales (Google, Yahoo, Bing y cualquier otro que se os ocurra) y pescando los pececillos superficiales que están al alcance de todos, cuando la foto real es ésta:


Invisible

Los buscadores tradicionales van recorriendo páginas que están en la superficie, en el sentido de que son páginas estáticas que además están enlazadas por o con otras páginas. Usan robots, programas que recorren páginas web. ¿Todas? No, ni mucho menos. Sólo aquéllas que saben o quieren ser vistas por los buscadores.


Así que no vemos aquellas páginas que se han quedado obsoletas y no han sabido o no les ha valido la pena actualizarse para que las encuentren los buscadores. O aquellas con contenido privado o documentos en formatos que no pueden ser indexados por esos mismo buscadores. Y, sobre todo, no tenemos acceso por la vía normal a aquéllas que no desean ser encontradas. No es tan difícil, en el caso de Google hay una variable Follow / No Follow que hace que el buscador se salte las páginas marcadas con esta última etiqueta.



¿Qué me estoy perdiendo? 
Como en uno de los artículos de NeoTeo explican como entrar, vamos a dejar claro que te estás perdiendo, entre otras cosas, mucha, mucha mierda de la más gorda, ilegal, asquerosa y despreciable de lo que seas capaz de imaginar. Así que cuidado y mucha más lectura de la que yo he hecho hasta ahora antes de ponerte las bombonas y lanzarte a bucear.


Aquí un vídeo que también está en el artículo de NeoTeo,  que es la principal fuente para este post y que lo explica todo mejor y en más detalle que aquí. Yo sólo os quiero hacer un resumen para poneros los dientes largos, como se me han puesto a mí.



link: http://www.youtube.com/watch?v=AQ9iblkb57I&list=HL1335913629&feature=mh_lolz
leyéndolos a
ellos. 

Pero también es la puerta a muchas bases de datos con enormes cantidades de información sobre cualquier área científica o tecnológica en la que "
los gobiernos mantengan investigaciones constantes hasta bibliotecas de millones de tomos, diccionarios, sitios de noticias anónimos, datos financieros, hemerotecas, sitios de personas y empresas, publicaciones digitales de libros, y una fauna de copias de leyes, álbumes de fotografía histórica, directorios con información de personas y sus correos electrónicos o números telefónicos, informes como los de Wikileaks, foros de agrupaciones anónimas, comentarios de redes sociales, marcadores sociales, discusiones en foros, entre tantos otros contenidos que te estés imaginando
." (entre comillas, cita exacta del artículo de NeoTeo)



¿Qué es lo que Google no sabe ver? (un poquito más técnico) 


Ni Google ni ningún otro buscador te van a devolver en sus búsquedas:


Páginas dinámicas
: no son fijas, cambian con el tiempo, según el usuario que accede a ellas, preferencias establecidas al hacer login, ... Páginas a las que accedes a través de un formulario, haciendo login en algún sitio, hay muchas posibilidades y muchos tecnicismos pero en el enlace de la wikipedia puedes aprender, si tienes curiosidad.


- Páginas que no enlazan a otras páginas ni están enlazadas por otras páginas.


- Páginas privadas, que se acceden mediante usuario y contraseña u otro tipo de identificación.


- Páginas cuyo acceso está limitado mediante algún método como el
Robots Exclusion Standard
, o 
CAPTCHAs

- Páginas accesibles únicamente mediante JavaScript o cuyo contenido se descarga dinámicamente con Flash o Ajax.


- Contenido no html, ni texto ni tipos de multimedia con los que los navegadores al uso no se molestan en lidiar (decir que no saben me parece inocente, ya me extrañaría que el amo de Google no se pueda navegar la Deep Web esta en batiscafo con cama redonda y luces de ambiente si le da la gana)


- Páginas en protocolo Gopher u otros. De hecho Google no se molesta en recorrer nada que no sea http (al menos para ti


Resumiendo, los buscadores tradicionales recorren muchísimas páginas pero tienen que hacerlo rápido. No te gustaría si se bucearan todo el mar y te dieran los resultados tres meses más tarde y a ellos les causaría un esfuerzo y un derroche de medios que tienen que optimizar. Así que buscan lo más habitual, lo que más se usa: protocolo http, páginas en html, documentos de texto normales .doc, .txt, .pdf, .mobi, etc, archivos multimedia en formatos que se usan bastante. Pero no buscan "rarezas".  




¿Como accedo? 
Con cuidado y anonimamente. Aunque no siempre es necesario hacerlo así porque como ya hemos comentado una parte del contenido es inocente, el hecho de recomendar la navegación anónima es más por si con un click nos metemos inadvertidamente en algún sitio claramente delictivo que nos meta en un fregao nivel FBI. Me encanta el diagrama que colocan en el artículo de Nico Varonas: 


Deep
Sobre todo esa parte que dice en la flecha de la derecha: elige entre usar un proxy o decirle ¡hola! al FBI.


En el 2005 Yahoo trató de hacer una parte pequeña de la Deep Web accesible mediante el lanzamiento de Yahoo! Subscriptions 


Existen buscadores de bases de datos bastante seguros como
CompletePlanet 

Acceso anónimo a la web 


Si os decidís a aprender a bucear por las profundidades de la red, creo que es interesante que investiguéis todas las posibilidades. Ya sabéis que ando pochina, así que simplemente redactar un artículo como éste me lleva ratos y ratos pero en cuanto me recupere, lo intento todo y os cuento.


El rey del acceso anónimo a la red es 
Tor Project, the onion router
. Otra posibilidad es
 FreeNet


Aunque, de usar algún método, yo probaría el que explican en NeoTeo en el artículo "
Cómo acceder a la Deep Web con Tor
". Dejo abajo todos los enlaces.



Enlaces:


Deep Web: el lado invisible de la web
Cómo acceder a la Deep Web con Tor
White paper: The Deep Web 
Crawling the hidden web (pdf) 
BrightPlanet White paper (pdf)
Downloading hidden web content (pdf)
Searching for hidden-web databases (pdf)
Google's Deep-web crawl (pdf) 





Que aquí hay mucho que estudiar y currar para el que le interese meterse hasta las cachas, pero creo que también es importante que se sepa que esto es así. Como las novelas de China Mieville están llenas de ciudades del submundo, las de Simon R. Green de un Londres perverso y secreto al que se accede desde las estaciones de metro o el mundo de los Dresden Files amenazado por una guerra entre seres mágicos sobre la que los mortales están en la inopia, así la amable web por la que le preguntas a Google está sobresaliendo por encima de una gigantesca montaña de páginas escondidas de las que ahora estás un poco más cerca.



Abrazo y parte de novedades: el marcapasos de mi madre funciona y ella ya me llamó diciendo que estaba en condiciones de cuidarnos al montañés y a mí (¡¡¡!!! es mi ídola, tiene más valor que el Guerra). El montañés emprende rehabilitación a saco del tobillo (rotura de ligamento peroneoastragalino anterior y bastante inestabilidad) a ver si se puede librar de una cirugía horrrrrrrenda en la que te parten un ligamento (peroneo largo) por la mitad y se ponen a darle vueltas y hacerle lazos por el tobillo como si te lo estuvieran fijando con cinta americana pero por dentro. Si se opera son dos meses escayolao sin apoyar y otros dos de rehabilitación, probablemente para no poder volver a la montaña ni correr, y parece que otros médicos opinan que rehabilitar es posible así que lo vamos a intentar. Libre por fin de mis dos principales preocupaciones, he atacado por mi cuenta la maniobra de Epley contra los vértigos y funciona, parece que cada ver me duran menos y cuando la hago, pasado el primer mal rato, tengo un par de horas de perfecta tranquilidad.



Con tanta leñe como entenderéis no me ha dado tiempo de ponerle adornicos de Navidad al blog, que me han informado que lo propio es poner los adornicos el puente de la Inmaculación, también llamado de la Constitulada y quitarlos después de Reyes.