Hay más archivos completos en otros idiomas y versiones en el proyecto Kiwix, con distintas opciones de descarga – aunque la mejor es el tradicional torrent. Estas recopilaciones no contienen imágenes –incluso en miniaturas ocuparían más de 100 GB– pero sin duda el texto ya merece la pena, al menos si tienes un poco de Diógenes digital. El formato en que está el fichero es OpenZIM, pensado especialmente para archivar y leer wikis; hay versiones para OS X, Windows y Linux
|
etiquetas: wikipedia , descarga , fichero torrent
Descarga en inglés: download.kiwix.org/zim/0.9/wikipedia_en_all_nopic_01_2012.zim.torrent
Proyecto Kiwiz: kiwix.org/index.php/Main_Page#Wikipedia_files
Vía: www.microsiervos.com/archivo/internet/wikipedia-wikix-torrent.html
www.wikitaxi.org/delphi/doku.php/products/wikitaxi/index
Con wikitaxi lo que haces es bajar un dump SQL de las entradas y convertirlo a su formato (vamos, que recrea el indice), y se viene a quedar en unos 12 gigas.
Es muy util, aunque no sea lo ideal.
Claramente esto no está pensado en el chico con 40 MB, cuatro computadores, wifi, que vive en París.
Creo que el tonto eres tú al pensar que wikipedia va a estar ahí online para siempre para ti.
#3 Ten más personalidad hombre ...
#7 ¿Nunca has comprado una enciclopedia? ¿Tús padres no tienen una? Nada más comprarla la enciclopedia ya está obsoleta. La wikipedia la actualices o no, ya está obsoleta.
Menudo absurdo.
No me parece para nada una tontería. Y ademas, por 10Gb...
No es tan difícil buscar un uso práctico. Es una situación que a más de uno nos habrá pasado.
dumps.wikimedia.org/enwiki/20120403/
Hacia 2010 me bajé el dump en inglés para hacer una proyecto para el máster, menuda locura, millones y millones de palabras, sólo de pensarlo me agobio.
¿Alguien sabe si está contenido el historial de ediciones de cada artículo o solamente es un snapshot de cada artículo? 10 Gb de solo texto (que se descomprimirá a 30Gb) me parece una barbaridad.
meta.wikimedia.org/wiki/List_of_Wikipedias
Me autorespondo: 30Gb de texto entre 4 millones de artículos = 8 Kb por artículo en la versión inglesa, lo cual parece razonable.
Lo que sigo sin comprender es cómo tanto la inglesa como la española pueden ocupar lo mismo. :-?
Mira que esto es algo que no soporto. El byte NO es una unidad de masa.
buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=pesar
Y que se haya convertido en una costumbre para mucha gente (incluídos profesionales del sector) no lo convierte en válido. Sólo hace más sangrante el uso incorrecto de la expresión.
es.wikipedia.org/wiki/Idiota
Al final la "memoria" tiene que tener un soporte físico para ser almacenada, y eso implica un peso y un volumen (aunque sea de manera indirecta).
Repito, ¿cuál sería la expresión correcta?
Pillas la analogía?
Sigo optando por la humildad y la educación, al volver a pedirte, si eres tan amable (tú o cualquieria que pueda hacerlo), que me saques de mi error.
Y por lo que veo, al menos en los filenames, el dump de la wiki española ya convertido para kiwix incluye las imágenes, lo cual explicaría el tamaño (imagino que solo a tamaño pequeño tal como se ven en el artículo, y no la completa lógicamente). El dump que tenía yo hasta ahora para usarlo en WikiTaxi eran 1,8gb la española y unos 9 gb la inglesa (del 2-07-2011 y 20-06-2011 respectivamente), y la española no ha crecido tanto con lo que está claro de donde viene la diferencia.
Ok, ¡gracias!
#34 El byte NO es una unidad de masa.
¿Seguro? www.vidainformatico.com/2009/07/discos-duros-antiguos.html
#39 Te dejo que te documentes acerca de cómo se guarda la información, y ya verás que no implica ni peso, ni volumen.
¿Conoces la expresión "it from bit"?
Te dejo que te documentes.
</porirdelisto>
Por lo demás, vete con el otro a ver cómo funcionan las cosas, anda. Y fin, que de verdad, mareáis.
No, uno de los mayores físicos del siglo XX que decían eso.
So necio.
</'nastardes>
Puntos a favor de Kiwix:
WikiTaxi muestra un formato más simplificado, mientras que Kiwix lo muestra idéntico, o casi idéntico a la wikipedia original. Kiwix es mas rápido mostrando el artículo completo, que WikiTaxi se atraganta un poco al abrir un artículo largo. En WikiTaxi los enlaces externos no funcionan, mientras que en Kiwix te los abre con el navegador por defecto. El formato .zim es abierto, con lo que aunque ahora mismo no haya es probable que surjan más programas capaces de abrirlo, mientras el formato .taxi del WikiTaxi es cerrado. Kiwix soporta imágenes siempre que el dump usado las incluya, cosa que WikiTaxi no. Kiwix es multiplataforma, basado en Mozilla, mientras que WikiTaxi está hecho en delphi y es de código cerrado con lo que es solo para Windows (aunque funciona perfecto con Wine/Darwine). WikiTaxi tarda en mostrar fórmulas matemáticas en los artículos (de hecho es opcional y no lo hace por defecto), mientras que Kiwix diría que las pre-procesa como imágenes? aquí no estoy seguro. Kiwix permite seleccionar, copiar, e imprimir, mientras que WikiTaxi creo que solo imprimir.
Puntos a favor de WikiTaxi:
WikiTaxi requiere menos CPU y RAM, salvo para la conversión inicial. Aunque no ofrecen para descargar la wikipedia ya convertida ,puedes descargarte tu mismo un dump mas o menos actualizado (suelen llevar como mucho un mes o dos de retraso) y convertirlo. La conversión le lleva desde unos 30 minutos hasta unas 5 horas, según la wiki que sea. En Kiwix es algo mucho más complicado de hacer y suelen tardar más en colgar los dumps ya convertidos. WikiTaxi incluye el índice en el fichero ya convertido, lo cual lo engorda pero también hace que una vez convertido sea solo cosa de abrirlo y buscar, mientras que Kiwix tiene que indexarlo la primera vez que lo abres, y tiene que hacer esa operacion en cada PC o sistema operativo que uses (aunque eso sí, mientras lo hace ya puedes consultar las partes ya indizadas).
#55, no estoy totalmente seguro de eso porque aún no he bajado la wiki española, pero parece lógico entre el tamaño y los filenames. El fichero inglés se llama wikipedia_en_all_nopic_01_2012.zim y el español wikipedia_es_all_03_2012.zim sin lo de "nopic".
Ahora hablando en serio, hace unos años que existe este proyecto CDPEDIA python.org.ar/pyar/Proyectos/CDPedia
Es un proyecto de Python Argentina para acceder a la información de la Wikipedia en castellano aunque no tengas una conexión a Internet.
Toda la información incluída fue obtenida de Wikipedia durante Febrero del 2011, y es una foto del contenido on-line en un momento dado. Te sugerimos acceder a la información directamente en la Wikipedia Web si es que necesitás información actualizada de uno de los temas.
Importante: la CDPedia es Software Libre, te recomendamos (y te agradecemos) que copies estos discos y los regales a tus amigos, familia y conocidos. La información debe ser libre, así mejoramos la calidad de nuestra educación.
Puedes bajarte o el cd de 700 mg o el DVD de 4 gb... bueno, ya no son 10gb para los menos exigentes.
Es más, espero que en tu vida diaria no digas cosas como "Mi peso es de setenta kilogramos" porque el peso NO ES UNA UNIDAD DE MASA¹
#30 Desde mi punto de vista, aunque no soy lingüista (soy físico), está bien usado
Según la RAE:
Peso: 21. m. Mat. Valor asociado a un número de un conjunto con el que, según el criterio que corresponda, se expresa la importancia del mismo en el conjunto.
Yo bajo esa definición no veo ningún problema en la asociación "unidad de información (bit)" - "peso".
¹Es más, diría que es más incorrecto decir "Esa persona tiene un peso de setenta kilogramos" que "Ese archivo tiene un peso de siete bytes", pero eso ya es ponerse puntilloso, pedante y retorcido