edición general
397 meneos
2491 clics
La Wikipedia al completo, descargable en un solo fichero torrent de  cerca de 10 GB [EN]

La Wikipedia al completo, descargable en un solo fichero torrent de cerca de 10 GB [EN]

Hay más archivos completos en otros idiomas y versiones en el proyecto Kiwix, con distintas opciones de descarga – aunque la mejor es el tradicional torrent. Estas recopilaciones no contienen imágenes –incluso en miniaturas ocuparían más de 100 GB– pero sin duda el texto ya merece la pena, al menos si tienes un poco de Diógenes digital. El formato en que está el fichero es OpenZIM, pensado especialmente para archivar y leer wikis; hay versiones para OS X, Windows y Linux

| etiquetas: wikipedia , descarga , fichero torrent
208 189 1 K 585 mnm
208 189 1 K 585 mnm
Comentarios destacados:                
#4 Acabo de actualizar una entrada, el que se la baje tendrá una versión obsoleta :troll:
  1. #2 Pues yo estaba en ello... Ahora corto.
  2. Acabo de actualizar una entrada, el que se la baje tendrá una versión obsoleta :troll:
  3. #2 Hay muchos buenos motivos para bajar el archivo, es sólo que a ti no se te ha ocurrido ninguno ;)
  4. #2 Mmmm no entiendo por qué es una idea tan absurda. Me lo explicas? En serio, sin acritud! A parte del problema que comenta #4, me parece una herramienta muy útil.
  5. #7 ¿De verdad hace falta explicarlo? ¿Qué sentido tiene bajar un "snapshot" de un proyecto colaborativo tan vivo y cambiante como es la wikipedia? Como bien apunta #4 solo sirve para tener una copia obsoleta.
  6. #8 es cierto que a cada segundo se queda obsoleta, pero yo creo q por 10 Gb de nada merece la pena tener una copia offline, aunque este un poco desactualizada. Si fueran 100 Gb... pero hoy 10 Gb no van a ningún sitio. Yo por lo menos me lo descargaré para tener en el portátil.
  7. Cuando en unos años la prohíban o la vayan a modificar hasta el extremo y se empiece a pensar en hacer copias para descargar este será un buen precedente, sirve al menos para ir preparándose o para si lo hacen de golpe como con MU.
  8. Yo ya la llevo usando offline desde hace años con WikiTaxi, la actualizo un par de veces al año, y la verdad vale la pena cuando no tienes conexión y necesitas una consulta rápida.

    www.wikitaxi.org/delphi/doku.php/products/wikitaxi/index

    Con wikitaxi lo que haces es bajar un dump SQL de las entradas y convertirlo a su formato (vamos, que recrea el indice), y se viene a quedar en unos 12 gigas.

    Es muy util, aunque no sea lo ideal.
  9. #8 No es lo ideal pero si no tienes Internet, piensa en millones de personas en el mundo en desarrollo que tienen computadores/ordenadores y no tienen acceso Internet por diversos motivos, y las enciclopedias tradicionales offline son mucho menos completas.

    Claramente esto no está pensado en el chico con 40 MB, cuatro computadores, wifi, que vive en París.
  10. #5 Únicamente se me ocurre para entrenar algún tipo de algoritmo bayesiano, crear como comenta #12 alguna versión offline,...que ya es!
  11. En un torrent, luego es piratería, el p2p para lo único que sirve es para piratear cosas. ;)
  12. #2 ¿Gilipollas el tener un backup de una de las enciclopedias más grandes y actualizada del mundo?
    Creo que el tonto eres tú al pensar que wikipedia va a estar ahí online para siempre para ti.

    #3 Ten más personalidad hombre ...

    #7 ¿Nunca has comprado una enciclopedia? ¿Tús padres no tienen una? Nada más comprarla la enciclopedia ya está obsoleta. La wikipedia la actualices o no, ya está obsoleta.
    Menudo absurdo.
  13. Esto nos vendrá muy bien en el futuro postapocalíptico que se avecina, solo hay que guardarla en un portátil alimentado por paneles fotovoltaicos y guardarlo en una jaula de Faraday hasta el día en que sea necesario tener esa información.
  14. #15 Veo que en #3 me ha faltado el tag </ironic> o el imoticono :-)
  15. Yo me lo descargaré como un seguro en caso de un apocalipsis. Esos 10GB tendrían un valor incalculable.
  16. Creo que por ley deberíamos obligar a tener a todo el mundo una copia de la wikipedia. Imaginad si sobreviene el desastre tecnológico (el mineralismo va a llegar) lo que iba a ahorrarnos de tiempo...(bueno, eso asumiendo que aún queda un ordenador para leerla después, que igual es mucho asumir :-D)
  17. ¿Y luego se puede actualizar con rsync? Porque aunque con bittorrent debería poderse, normalmente los programas de Bittorrent no están preparados para actualizar fácilmente.
  18. #7 Te lo explico: Megaupload.
  19. #8 Mejor una copia "obsoleta", con miles y miles de artículos que apenas vas a sufrir modificaciones, que nada. Hay miles de sitios donde el acceso a internet no es inmediato, o dispositivos como ebooks que podrían llevar una copia de esto para consultarlo en cualquier momento.

    No me parece para nada una tontería. Y ademas, por 10Gb...
  20. #8 Seguro que hace diez años, alguien como tú decía lo mismo de geocities. O hace un año, de megaupload. Aunque la nube sea la hostia en verso, y todos los sistemas son redundantes y todas esas cosas, alguien habrá que prefiera guardar esos 10GB que correr el mínimo riesgo.
  21. #11 Gracias por la info. ¿Cuál es la diferencia entre "Kiwix" del meneo y el que usas "Wikitaxi"? Conozco a gente que colabora con campamentos de refugiados saharauis y seguro que les interesa.
  22. Me voy este fin de semana al pueblo, a mi casa de veraneo, donde no tengo internet, sin embargo estoy haciendo un trabajo y necesito usar la wikipedia.

    No es tan difícil buscar un uso práctico. Es una situación que a más de uno nos habrá pasado.
  23. Hem, aparte del formato, no sé qué tiene esto de nuevo, la propia mediawiki ofrece los dumps de sus bases de datos en formatos 7zip y tar.bz2 para descargar desde el principio de los tiempos.

    dumps.wikimedia.org/enwiki/20120403/

    Hacia 2010 me bajé el dump en inglés para hacer una proyecto para el máster, menuda locura, millones y millones de palabras, sólo de pensarlo me agobio.
  24. #15 tranquilo que ahora la subo yo a megaupload
  25. Yo ya tengo todo internet en un .rar, no necesito estas menudencias.
  26. Pregunta: ¿cómo es posible que ambas pesen lo mismo (10Gb), si la inglesa tiene casi 4 millones de artículos y la española todavía no llega a 1 millón?

    ¿Alguien sabe si está contenido el historial de ediciones de cada artículo o solamente es un snapshot de cada artículo? 10 Gb de solo texto (que se descomprimirá a 30Gb) me parece una barbaridad.

    meta.wikimedia.org/wiki/List_of_Wikipedias
  27. Importante noticia, sobre todo para los programadores, ya que se podrán hacer aplicaciones de escritorio sin necesidad de conexión a Internet. También abre la puerta para poder pequeñas aplicaciones para tablets que no tengan conexión de telefonía móvil y por tanto puedan funcionar sin necesidad de WIFI. Utilizándose esta para las actualizaciones. Me parece una idea fantástica y me reafirma en la mejora de este proyecto altruista que trata de llevar el conocimiento a todos. Si queréis leer alguna reflexión sobre wikipedia os dejo un link al post "La wikipedia se carga los trabajos del cole" adf.ly/6GPc1
  28. #30 ¿Alguien sabe si está contenido el historial de ediciones de cada artículo o solamente es un snapshot de cada artículo? 10 Gb de solo texto (que se descomprimirá a 30Gb) me parece una barbaridad.

    Me autorespondo: 30Gb de texto entre 4 millones de artículos = 8 Kb por artículo en la versión inglesa, lo cual parece razonable.

    Lo que sigo sin comprender es cómo tanto la inglesa como la española pueden ocupar lo mismo. :-?
  29. Siempre está bien tener copias de seguridad distribuida. Si mañana deciden cargarse la wikipedia por cualquier medio (pueden aprobar unas cuantas leyes y chapar sin previo aviso) podrá renacer fácilmente sin perder el trabajo de muchos años.
  30. #30 "Pregunta: ¿cómo es posible que ambas pesen lo mismo"

    Mira que esto es algo que no soporto. El byte NO es una unidad de masa.

    buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=pesar

    Y que se haya convertido en una costumbre para mucha gente (incluídos profesionales del sector) no lo convierte en válido. Sólo hace más sangrante el uso incorrecto de la expresión.
  31. Lo mejor de todo es que los carcas hablan de que esto no es cultura. Eso sí, tener que pagar cientos de miles de pesetas por una enciclopedia (como las de antes, que yo nunca pude tener una) es lo mejor...
  32. 500 GB para el pr0n y 10 para la Wikipedia, tampoco es para tanto. :troll:
  33. #2 Yo me la descargo porque hay artículos que hace años que son válidos, como por ejemplo el de "Idiotez"

    es.wikipedia.org/wiki/Idiota
  34. #34 Lo pregunto sin ánimo alguno de "trolear" y desde la más absoluta humildad y buena voluntad: ¿Acaso sería correcto decir "ocupa 10 GB"? Que yo sepa el byte tampoco es una unidad de volumen, así que la expresión también sería incorrecta, ¿no?.

    Al final la "memoria" tiene que tener un soporte físico para ser almacenada, y eso implica un peso y un volumen (aunque sea de manera indirecta).

    Repito, ¿cuál sería la expresión correcta?
  35. #38 Te dejo que te documentes acerca de cómo se guarda la información, y ya verás que no implica ni peso, ni volumen.
  36. Yo ya me la estoy imprimiendo, aunque creo que voy a tener que bajar a comprar un paquete de folios.
  37. #6 Comprar esto también era una tontería, no?
    Pillas la analogía?  media
  38. #8 ¿La posibilidad de llevar la mayor colección del saber a un colegio donde no tienen internet no te parece buena idea? ¿Tampoco para países del tercer mundo? ¿ni para reducir tráfico de red?
  39. #39 Pues hasta donde se, y he podido leer, el almacenamiento de información implica el uso del algún tipo de soporte físico, sea cual sea el mecanismo implicado (magnetización o lo que sea). No estoy diciendo que se guarde en cuentas de madera, ni en microsurcos en un disco de vinilo... pero se necesita algo físico, en definitiva.


    Sigo optando por la humildad y la educación, al volver a pedirte, si eres tan amable (tú o cualquieria que pueda hacerlo), que me saques de mi error.
  40. Yo la tengo offline en el movil gracias a wikidroid. Es mi ebook favorito y para leer mientras viajas es lo mejor.
  41. Con este torrent y esta otra base de datos: playmatehunter.com/playboys-playmate-index#char_75 ¿quien necesita internet?
  42. #25, en una hora y media te lo cuento (que el Kiwix no lo he probado y es lo que me falta para tener el torrent). De momento diria que el WikiTaxi está limitado por ser solo para windows, aunque puedo decir que funciona bastante bien en Wine. Eso si, no permite seleccionar texto para copiarlo, lo cual es una gran cagada en mi opinión. El Kiwix lo conocía de oídas pero no lo había probado porque de la que lo miré solo tenían copias bastante anticuadas de la wikipedia, pero como vaya bien y lo mantengan actualizado, probablemente no vuelva a usar WikiTaxi.
  43. #30, tienen para bajar en varios formatos, aunque el que se usa para wikitaxi y por lo que he mirado tambien para kiwix es el es(en.. lo que sea)wiki-(fecha)-pages-articles.tar.bz2, que creo que es un dump sql (no lo he extraido para ver el formato) de solo los artículos actualizados a fecha del dump, sin incluir historial ni páginas de discusión.

    Y por lo que veo, al menos en los filenames, el dump de la wiki española ya convertido para kiwix incluye las imágenes, lo cual explicaría el tamaño (imagino que solo a tamaño pequeño tal como se ven en el artículo, y no la completa lógicamente). El dump que tenía yo hasta ahora para usarlo en WikiTaxi eran 1,8gb la española y unos 9 gb la inglesa (del 2-07-2011 y 20-06-2011 respectivamente), y la española no ha crecido tanto con lo que está claro de donde viene la diferencia.
  44. #19 Yo guardo colecciones enteras de libros de texto de física, química, matemáticas, etc,..., casi cualquier asignatura que he podido dar desde pequeño, así como de historia, electrónica, lengua, idiomas, comunicaciones y cualquier cosa que sea educativa...por si acaso.
  45. #43. Un lápiz usb del tamaño de tu dedo meñique, Ese peso y volumen necesita.
  46. #46 Gracias. Pues sí, ser monoplataforma y no poder seleccionar texto son grandes inconvenientes. Espero que Kiwix los solvente.
  47. si tienes un poco de Diógenes digital... ahí me ha pillado. Bajando.
  48. #30 es posible que se deba a que el español tiene más redundancia que el inglés (el mismo texto en español es más largo que en inglés). Así, aunque tenga menos artículos, estos son más largos y ocupan más.
  49. #48 el dump de la wiki española ya convertido para kiwix incluye las imágenes

    Ok, ¡gracias!

    #34 El byte NO es una unidad de masa.

    ¿Seguro? www.vidainformatico.com/2009/07/discos-duros-antiguos.html :troll:

    #39 Te dejo que te documentes acerca de cómo se guarda la información, y ya verás que no implica ni peso, ni volumen.

    ¿Conoces la expresión "it from bit"?

    Te dejo que te documentes.

    </porirdelisto>
  50. #55 Y qué me pones? Una web que dice eso? En Internet si buscas encontrarás webs que hasta dicen que a JFK se lo llevaron los alienígenas, y que Hitler sigue vivo en la Luna.

    Por lo demás, vete con el otro a ver cómo funcionan las cosas, anda. Y fin, que de verdad, mareáis.
  51. #56 Y qué me pones? Una web que dice eso?

    No, uno de los mayores físicos del siglo XX que decían eso.

    So necio.

    </'nastardes>
  52. A insultar, te vas a otro lado. Sigue si te apetece, "nastardesman".
  53. #51, lo he probado un poco por encima con la wiki inglesa bajo Linux y diria que kiwix es bastante mejor en casi todo.

    Puntos a favor de Kiwix:
    WikiTaxi muestra un formato más simplificado, mientras que Kiwix lo muestra idéntico, o casi idéntico a la wikipedia original. Kiwix es mas rápido mostrando el artículo completo, que WikiTaxi se atraganta un poco al abrir un artículo largo. En WikiTaxi los enlaces externos no funcionan, mientras que en Kiwix te los abre con el navegador por defecto. El formato .zim es abierto, con lo que aunque ahora mismo no haya es probable que surjan más programas capaces de abrirlo, mientras el formato .taxi del WikiTaxi es cerrado. Kiwix soporta imágenes siempre que el dump usado las incluya, cosa que WikiTaxi no. Kiwix es multiplataforma, basado en Mozilla, mientras que WikiTaxi está hecho en delphi y es de código cerrado con lo que es solo para Windows (aunque funciona perfecto con Wine/Darwine). WikiTaxi tarda en mostrar fórmulas matemáticas en los artículos (de hecho es opcional y no lo hace por defecto), mientras que Kiwix diría que las pre-procesa como imágenes? aquí no estoy seguro. Kiwix permite seleccionar, copiar, e imprimir, mientras que WikiTaxi creo que solo imprimir.

    Puntos a favor de WikiTaxi:
    WikiTaxi requiere menos CPU y RAM, salvo para la conversión inicial. Aunque no ofrecen para descargar la wikipedia ya convertida ,puedes descargarte tu mismo un dump mas o menos actualizado (suelen llevar como mucho un mes o dos de retraso) y convertirlo. La conversión le lleva desde unos 30 minutos hasta unas 5 horas, según la wiki que sea. En Kiwix es algo mucho más complicado de hacer y suelen tardar más en colgar los dumps ya convertidos. WikiTaxi incluye el índice en el fichero ya convertido, lo cual lo engorda pero también hace que una vez convertido sea solo cosa de abrirlo y buscar, mientras que Kiwix tiene que indexarlo la primera vez que lo abres, y tiene que hacer esa operacion en cada PC o sistema operativo que uses (aunque eso sí, mientras lo hace ya puedes consultar las partes ya indizadas).


    #55, no estoy totalmente seguro de eso porque aún no he bajado la wiki española, pero parece lógico entre el tamaño y los filenames. El fichero inglés se llama wikipedia_en_all_nopic_01_2012.zim y el español wikipedia_es_all_03_2012.zim sin lo de "nopic".
  54. #32 Habría que ver la densidad de palabras y el número de cáracteres de los artículos en español comparados con los ingleses, pero algo me dice que tiene que ver con la longitud de las palabras y frases de cada idioma.
  55. #59 Muchas gracias. Gran comparativa, le pasaré los datos a mis amigos de la ONG.
  56. Bajada... ahora a imprirla :-)
  57. Pues no es ninguna tontería hacer una copia de seguridad de la Wikipedia, parece que muchos olvidaron la que lío Borja Perez de que vida mas triste. Meter un virus en youtube y cargarse todos los servidores, eso si, sin querer. www.youtube.com/watch?v=8ZOuI6h4uRQ

    Ahora hablando en serio, hace unos años que existe este proyecto CDPEDIA python.org.ar/pyar/Proyectos/CDPedia

    Es un proyecto de Python Argentina para acceder a la información de la Wikipedia en castellano aunque no tengas una conexión a Internet.

    Toda la información incluída fue obtenida de Wikipedia durante Febrero del 2011, y es una foto del contenido on-line en un momento dado. Te sugerimos acceder a la información directamente en la Wikipedia Web si es que necesitás información actualizada de uno de los temas.

    Importante: la CDPedia es Software Libre, te recomendamos (y te agradecemos) que copies estos discos y los regales a tus amigos, familia y conocidos. La información debe ser libre, así mejoramos la calidad de nuestra educación.

    Puedes bajarte o el cd de 700 mg o el DVD de 4 gb... bueno, ya no son 10gb para los menos exigentes. ;)
  58. #56 #34 Si tú sabes cómo funcionan las cosas, explícalo, por favor.

    Es más, espero que en tu vida diaria no digas cosas como "Mi peso es de setenta kilogramos" porque el peso NO ES UNA UNIDAD DE MASA¹

    #30 Desde mi punto de vista, aunque no soy lingüista (soy físico), está bien usado

    Según la RAE:
    Peso: 21. m. Mat. Valor asociado a un número de un conjunto con el que, según el criterio que corresponda, se expresa la importancia del mismo en el conjunto.

    Yo bajo esa definición no veo ningún problema en la asociación "unidad de información (bit)" - "peso".

    ¹Es más, diría que es más incorrecto decir "Esa persona tiene un peso de setenta kilogramos" que "Ese archivo tiene un peso de siete bytes", pero eso ya es ponerse puntilloso, pedante y retorcido
comentarios cerrados

menéame