"Tenéis grandes obras que hacer, establecer un nuevo cielo y una nueva tierra entre nosotros, y las grandes obras tienen grandes enemigos". Seguro que cuando Stephen Marshall escribió esta frase en 1641 no se imaginaba que las grandes obras serían las investigaciones en genética y los grandes enemigos, el Excel y, sí, el maldito autocorrector. Sé que suena raro. Pero un grupo de investigadores del Instituto Baker IDI de Melbourne ha descubierto que un alto porcentaje de investigaciones sobre genética podrían tener fallos producto de...
|
etiquetas: excel , investigación , genética , autocorrector
Pues eso, que pongan interés y aprendan a usar sus herramientas.
Pues eso, que pongan interés y aprendan a usar sus herramientas.
#3 Me gustaría a mi verte revisando un paper con tablas de miles de filas y 20 columnas en uno de los cinco archivos suplementarios. Ya de paso, supongo que también revisarías los millones secuencias (pongamos 250, que es lo que produce un canal de HiSeq) subidas a una base de datos cuando te envíen un transcriptoma. Y luego ya si eso que te quede tiempo para hacer tu propio trabajo.
Estos no son errores de mala fe, no hay en ellos nada de menosprecio a la ciencia.
Un proyecto serio necesita que alguno de investigadores tenga un conocimiento de ingeniería de datos y pueda usar paquetes tipo Mathematica o Matlab y/o programar en algún lenguaje tipo R o Scala.
Hace tropecientos años, no existía Internet, hice un curso del Inem (de esos que pagaban) y nos enseñaron a usar una tabla de calculo, era super sencilla y la presentación muy estética. Me gustaría encontrar algo parecido.
Excel es antipático y feo de cojones.
Excel tiene la ventaja de ser intuitivo y fácilmente manejable por cualquiera. Jamás vas a presentar una tabla de conclusiones a tu supervisor de 60 años en formato texto o csv siquiera. Es más, las revistas no te aceptan normalmente esos formatos, sino que suelen publicarlos en Excel u, horror, pdf.
Por lo demás, Excel es perfectamente válido a cualquier nivel, bioinformático o pelagatos, hasta un límite de tamaño, pero unos miles de líneas tampoco le veo un gran problema.
Pir lo menos pedirle a alguien que se curre una macro para detectar errores. Un saludo
www.r-bloggers.com/5-ways-to-do-2d-histograms-in-r/
en.wikipedia.org/wiki/R_(programming_language)
Y si no alternativas como Matlab, Octave...
ME esta empezando a inflar los cojones el puto excel con el formato de celdas.
Ya, sería muy bueno tener más conocimiento de computación. Poco a poco se va solucionando, pero esta disponibilidad de datos ha cogido al campo casi por sorpresa, adaptarse no es fácil.
También es notable que los biólogos tenemos muy poco conocimiento de estadística, cosa que es todavía peor.
No es culpa de MS Excel, es culpa de no usar las herramientas adecuadas.
Mira, yo antes era de los que rajaba de excel, pero aprendí a usarlo bien, con power query, y es otro planeta con respecto a lo demás.
Ayer estaba buscando información en internet respecto al formato de guardar números como texto, comprobando que mi excel no se comporta como indican los artículos. Hoy me encuentro a excel en portada justo por fallos aplicando el formato.
Me está empezando a tocar los cojones el excel...
Aquí tienes una captura tras horas intentando que una columna de numeros de telefono me la trate como texto de manera uniforme. Basicamente, o le pongo un "0" o "+" delante o lo sigue tratando como número.
Como software científico es la mar de flexible y cuando hemos encontrado bugs se han corregido entre 24 h y 3 días después
Trolean los que usan excel...
"Para que me voy a complicar la vida aprendiendo XXXXX si tengo el excel..."
Y no sólo eso, sino que el director es el que tiene que saber hasta qué punto son necesarios como para contratar a uno, a uno y medio o a tres, y normalmente no lo saben, porque se formaron antes de que hubiese tanto high throughput y tanta gaita. Aún más, los propios investigadores que lleven cada proyecto en un laboratorio deberían saber cuándo pedir ayuda al bioinformático, y eso no ocurre. Falta de conocimientos, sentido de posesión de los datos, "esto lo puedo apañar yo mismo que no pasa nada", saturación del bioinformático (que tiene su propio proyecto)...
Últimamente la RAE ha cedido y ha aceptado el punto como separador decimal en vez de la coma (de hecho creo que lo recomienda), así que a ver si lo ponen por defecto el en Excel en español de una vez, la gente se acostumbra a usarlo y nos olvidamos de la coma de los demonios.
El problema es que usen excel y no una herramienta diseñada especificamente para ese fin que disminuya la posibilidad de error humano al mínimo. Con lo baratos que estamos los informaticos en este país...
Autocorrección (matemática en este caso) te cambia alpha por "α" o también "qeu" por "que"
Tienes autocorrección, autocorrección matemática, autoformato....
Pero esto tiene que ver, #2 , con el formato de cada celda. Si no estableces de ante mano el formato de la celda, Excel intentará adivinar si lo que metes es texto, número, moneda, fecha... y le aplicará el formato correcto. En este caso tú pones SEPT2 y Excel piensa que es una fecha, el dos de septiembre, y te lo cambia. ¿solución? #7 clic derecho sobre la columna que lleva esos datos, o clic en la esquina de la hoja para aplicarlo a todas las celdas, y aplicarle el formato "texto" a la celda, así no te cambiará nada.
Las correcciones automáticas te hacen la corrección directamente cambiando el texto.
Yo siempre tengo desactivadas las corecciones automáticas. Que te sugiera una corrección, pae. Pero que te haga el cambio de modo automático ... soy yo quien escribe y quien debo decidir si es eso lo que quiero poner. El problema es que hay gente que o por desconocimiento o por "agilidad" (para no tener que repasar), confía en el corrector automático, y a veces te lían estas cosas.
(Sobre todo e ese nivel de investigación científica)
A una compañera haciendo el doctorado la tuve que enseñar a usar excel y word (no sabía ni justificar un texto). El problema es que en muchos países las carreras de ciencias no tienen estadística, y muchos programas de doctorado las dan como optativas (un par de semanas y para casa, así no aprenden nada).
Lo de bocazas y tal al otro usuario un pelín agresivo.
En el articulo, si el gen es sept-2 si se pone 'sept-2 excel lo considera una cadena de texto pero si ponemos sept-2 sin apóstrofo, excel automáticamente lo convierte en fecha.
Con eso no haría falta definir el formato de texto ni en celdas ni en columnas de esa hoja de cálculo.
Si lo haces al revés, es decir, si antes metes el número y después le cambias el formato a la celda poniéndolo en "texto", pasa lo que tienes en la imagen, que el número se sigue tratando como número aunque tenga formato texto.
Para arreglar el problema, selecciona las celdas afectadas, vete a la pestaña "datos", clica en "texto en columna", dale siguiente hasta el final, y al final pon "formato de los datos en columnas" en "texto" y finaliza. Tendrás los números convertidos en texto.
Y si no, que metan todo en una BD SQL y hagan las consultas a Excel con PowerQuery.
Si es que Excel es de lo más fácil de usar que hay. Si no saben R o Python por dios, que usen Excel bien por lo menos, que no es para tanto.
Yo he tenido compañeras inglesas haciendo el doctorado en síntesis orgánica, con un degree y MSc en química con el equivalente a sobresaliente de media que no sabían hacer diluciones seriadas, calcular molaridades y concentraciones, o calcular estequiometrías.
Yo en mi vida académica reciente (menos de 3 años fuera de la carrera), di estadística y en ella SPSS y excel. Maneje Excel para trabajos durante toda la carrera, y como optativa había tratamiento de datos estadísticos ( vamos manejar R).
Además de Word que sino como entregas tus trabajos y proyecto final y muchos más programas informáticos, que aunque no terminas de manejarlos al 100% bien per se, aprendes que es, como usarlo y para que sirve, cosa que luego te permite por tu cuenta ponerte a aprender siempre que quieras.
Hablo a nivel básico-medio, pero, quien no quiere saber más desde que hay internet es que es un dejado.
Me he quedado de piedra. ¿pdf un horror comparado con excel? Es decir una mala herramienta mal utilizada (creo que no es una base de datos que debería utilizarse en calculos cientificos serios) es mejor que un formato ampliamente aceptado por la comunidad cientifica para realizar publicaciones (es decir para presentar los datos, no para analizarlos)? Me parece que el problema de fondo está en tener investigadores muy buenos en sus especializades pero con muy poco conocimiento de las herramientas que deberían utilizar.
Y esto cuando se habla de análsis de datos aún empeora, ya que parece que muchos investigadores no saben aplicar bien las bases estadísticas (de ahí que ultimamente haya tantas revisiones de trabajos anteriores). He conocido investigadores en el campo de genética con trabajos publicados con analisis de datos que no sabían diferenciar en tre correlación y causalidad. Imagino que con lo de usar Excel pasa algo parecido.
Ahora mismo estoy en síntesis orgánica y nanomateriales, y veo gente inglesa con degrees y masters con medias de sobresaliente que no saben hacer cálculos de química de instituto.
1. Selecciono una columna en una hoja nueva y le cambio el formato a general
2. Copio los numeros y los pego en la columna definida como texto. Tambien pruebo a pegar solo los valores.
3. ????
4. Lo mismo
¡Están en formato texto! Pero si el ancho no es suficiente LO TRATA COMO NUMERO
Creo que es la primera gran decepción que me da excel. Muchas gracias. @sulfolobus_solfataricus
cc #69 Bocachancla.
También habría que plantearse si no estaremos utilizando herramientas que se meten donde no deben de meterse. Se supone que usan Excel para manejar fácilmente gran volumen de datos, el autocorrector está de más. Es algo accesorio. Pero como dije en la observación anterior, si estoy acostumbrado a usar cualquier cosa que me haga la vida más fácil ni siquiera me planteo esa cuestión (usar herramientas que hacen más cosas de las necesarias).
Por otra parte se nota que hay poca formación informática entre los científicos. Deberían salir de la universidad sabiendo usar R o Python o las herramientas necesarias para su trabajo profesional. Estamos hablando de aplicaciones que van a tener que utilizar. Si estudian matemáticas o biología o estadística o dibujo técnico porque lo necesitan en su vida profesional, también deberían saber manejarse bien con esas herramientas informáticas. Pero algo falla, supongo que la informática aun es muy reciente y necesita más tiempo para ser aceptada ampliamente.
Falla asi mismo la autoformación. R, Python, no deben ser muy difícil de aprender si uno se pone a hacerlo (incluso Excel). En mi caso particular R lo he aprendido por mi cuenta bajándome un manual gratuito. Y lo mismo Maxima, Gretl, etc. Sólo es ponerse a trabajar un poco, pero eso es ir contra la ideología de la vida fácil.
Para el formato de celdas lo que yo solía hacer era al principio seleccionar todas las celdas de la hoja y darles formato texto, y luego ya a cada celda o grupo le iba dando el formato correspondiente cuando era necesario.
Los análisis ya se han hecho con R y bien. Esto es un error tonto producido al pasar un fichero de texto a Excel para subirlo a la web.
Si Excel está bien configurado, se encarga automáticamente de la adecuación del formato del usuario.
El problema creo que es mas por el copia-pega de usuarios "garrulos", que se podría solucionar con un "pegar con formato", si mal no recuerdo.
www.sage.es/
Supongo que el software que dices se llama SageMath.
www.sagemath.org/es/
Hablamos de científicos garrulos que no saben utilizar Excel, pero nosotros no utilizamos el nombre correcto de una aplicación, o mejor dicho, el nombre actualizado, porque antes se llamaba Sage. Es el mismo problema en el fondo. "Toda la vida se ha llamado Sage, para qué voy a llamarlo como se llama ahora". "Yo uso Excel en el laboratorio porque es lo mismo que uso en casa para llevar las cuentas de la compra".
Yo en un master me encontré con un pavo que no sabia usar office. Ni Word ni excel ni pollas...Creo que acabó en Indra
cc #34
Era experto en aquel programa sencillo y llegué a hacer cosas muy interesantes, pero no me acuerdo ni como se llama ni donde encontrarlo. También es verdad que será un programa antiguo, incompatible con la mierda de Windows actual, tendré que usar el robot simulador de Windows XP, best windows ever.
A) Si no tienes los datos escritos:
1. Seleccionas la columna en donde vas a meter los números, le cambias el formato a texto.
2. Tecleas los números. Listo.
(Si pegas los números que proceden de una casilla malformada, aunque la casilla destino tenga el formato "texto", al pegar, se pegarán los datos igualmente malformados. Has de ponerlos de forma correcta antes de copiar y pegar, por eso te digo que teclees sin pegar nada)
B) Si ya tienes los datos escritos:
1. Seleccionas las celdas (ojo, las celdas, no la columna entera) en donde están los datos escritos.
2. Vas a la pestaña "datos" (ver imagen), botón "texto en columnas", le das a siguiente hasta la última pantalla. En la última pantalla, en "formato de los datos en columnas" seleccionas "texto".
3. Le das a "Finalizar"
C) Si quieres pegar los datos malformados de una columna a otra columna nueva:
1. Lo mismo que en el punto B.
2. Copias y pegas.
O también:
1. Seleccionas la columna en donde vas a meter los números, le cambias el formato a texto.
2. Copias los datos de la columna que contiene los datos.
3. Los pegas en el block de notas.
4. Los copias y los pegas en la columna distinta.
D) Tercera opción, aunque más costosa:
1. Antepones un ' a los números, por ejemplo: '666555444
Ha sido #70 el que ha dado en el clavo.
Raro... Raro... Raro... que estando como "números guardados como texto", los que no empezaban por 0 o tenian algún caracter no numérico, los trata como números mostrando la exponencial cuando no tiene ancho suficiente
Una chorrada, por supuesto, pero muchos por aquí estamos acostumbrados a que los programas nos obedezcan y sean predecibles.