Se nota descaradamente que han hecho estadísticas con noticias de la prensa o algo parecido. No me puedo creer que en el lenguaje cotidiano se emplee más la palabra gobierno o país que agua, hambre, sueño...
He encontrado seis fallos en el cuadro de las que son el 90% del total. En el siguiente cuadro se corrige, pero creo que sobran dos. No diré cuáles para que os entretengáis un rato
En esta noticia se nota de manera brutal la decadencia de la calidad de los comentarios de Menéame. de 28 comentarios sólo 2 han aportado algo a la discusión, el resto son intentos de chistes.
#10 La mayoría de los corpus están basados en textos, no en lenguaje oral. Si te fijas, Gobierno, economía y otras palabras que aparecen mucho en los periódicos suelen aparecer entre las más "comunes" en estas listas.
Eso será en España porque aquí en Zaragoza "CO" lo usa el 15% de la población en el 99% de sus frases. Lo que viene a ser los canis y sus "cos". Así, la conversación tipo de estos zagales vendría a ser: "¿Ke pasa co?", "Nada co".
Quizas esta lista parezca una tonteria pero puede ser util para aplicaciones de prediccion de texto como los teclados que suelen usar los telefonos mobiles o tambien han sido usados historicamente para descifrar textos ya que algunos cifrados no alteran la frequencia de las palabras es.wikipedia.org/wiki/Cifrado_César#Descifrado
Se debe haber sacado unicamente de publicaciones como periodicos, y sobre todo en esta epoca de elecciones. De otra forma no se entiende como palabras como "presidente" y "gobierno" están entre el 50% del total.
Por lo tanto no me parece un estudio concluyente ni digno de tener en cuenta.
#22#42 La info está sacada del CREA, el corpus actual de la RAE, que abarca textos periodísticos aunque también literarios comprendidos entre 1975 y 2003 (aprox). Aquí está la lista de frecuencias de las 10000 palabras más frecuentes (obviamente es un corpus de lengua escrita, y la lengua escrita nunca es igual a la oral) corpus.rae.es/frec/10000_formas.TXT
#44 Pero una cosa es que la lengua escrita sea diferente a la oral, y otra que la muestra se saque básicamente de periódicos, y especialmente de secciones de política. #42 tiene toda la razón, de otra manera no se entiende la frecuencia de ciertas palabras.
Claramente el corpus del que se ha extraído esto es sesgado, y esto una chapuza. No puedo creerme que gobierno y presidente estén entre las 130 palabras más usadas. Que sí, que nos preocupa mucho la política, pero vamos a ver, ¿dónde está partido y árbitro?
Porque si sale gobierno y presidente, partido tiene que salir, por la política, por el fútbol y por el participio. ¿O es que no se escribe de deportes?
#48 La info está sacada del CREA, el corpus actual de la RAE, que abarca textos periodísticos aunque también literarios comprendidos entre 1975 y 2003 (aprox).
Uno entra esperando ver mierda, cojones, putas y putos por doquier y se encuentra con presidentes y gobiernos... bueno, quitando lo de los cojones, sí que viene a ser más o menos lo mismo.
Yo diria que la palabra que mas se usa en español de españa es "vale". (en otros paises no)
Todos los extranjeros que viene a españa, aunque hablen español e incluso español nativo (sean hispanoamericanos por ejemplo). Se quedan alucionados con lo que se usa la palabra vale. Es la primiera palabra que aprenden de tanto oirla.
Ademas la palabra "vale" debe ser la palabra con mas significados del mundo. Por que vale para todo.
Si claro, "presidente, gobierno y país" son de las 130 palabras mas usadas, mas que patata. Pues no, estos de la Rae, que han hecho una estadística de una página de algún periódico y ya esta.
#39 del enlace de la wikipedia: A modo anecdótico, cabe señalar también que el capo mafioso Bernardo Provenzano, recientemente detenido, utilizaba para comunicarse, en pleno siglo XXI, notas escritas con una máquina de escribir, codificadas mediante este rudimentario algoritmo, renegando de cualquier tecnología nueva como el teléfono móvil o internet. A pesar de lo rudimentario del sistema, ha conseguido tener a la policía despistada durante años.
Un poco de clases de mates y estadística no le vendría mal a la poli
#62 Me quede flipado cuando descubrí que en argentina no se usaba, y una persona al saber que era español se despedia de mi diciendo "vale" porque sabia que los españoles la usábamos muchísimo
Pues seguro que es erroneo. Segun cita el articulo, su fuente es la web de la Real Academia Española. En concreto este documento: goo.gl/h5WkS
Le he echado un vistazo (no os penseis que me he mirado las 10.000 palabras ) y resulta que la palabra número 9.996 es la palabra "for". Me ha llamado la atención porque no sabía que "for" fuera una palabra española, asi que la he buscado en su propio diccionario: goo.gl/rB3gL
y dice que no existe.
¿Alguien me lo explica? Si hay una es probable que haya más que no existan en castellano
Ya podrian haberle pasado el diccionario a la lista
#67 Sí a los extranjeros les hace mucha gracia que tengamos una palabra que sirve para todo. De otros paises no hispanos a mi tambien me han hecho bromas con el "vale". Nosotros no nos damos cuenta pero la muchisimo y la usamos para todo. Realmente el español de españa es el idioma del "vale".
#68 Es que el corpus no está pasado sobre palabras que están en el diccionario, sino sobre palabras que se usan (aunque no estén en el diccionario) ;P Sobre qué debería o no debería ir en el diccionario... Uf, eso es otra batalla
#72 Me he picado, la curiosidad me ha podido y le he pasado el diccionario a las 2.000 primeras palabras. Pasando por alto apellidos, ciudades, mayusculas, etc.. me han salido cosas curiosas como letras sueltas, acronimos y alguna tilde de menos:
Consultando la fuente corpus.rae.es/frec/10000_formas.TXT podemos comprobar que la RAE no sabe usar sus propias normas, y confunden puntos y comas decimales.
Además, que esa lista está censurada o sesgada. La palabra "joder" no aparece entre las 10000 más usadas!
#76 goto #72 El corpus usado es el CREA, un corpus de la Academia donde se recogen textos escritos (literarios y periodísticos). No es tan raro que "presidente" salga tan arriba y no aparezca "joder"
#9#45 Por curiosidad he buscado que en alemán se necesitan unas 30 palabras para obtener una frecuencia del 30%, mientras que en español son 12 y en inglés 16.
Para llegar al 50%, en alemán 207, en español 130 y en inglés 57 (el inglés se estanca en proporción)
Hay que decirlo más.
Perdón, no sé contar.
www.youtube.com/watch?v=IJFuU-mKtEc
Ejemplo de uso: www.meneame.net/story/condenado-apoderarse-club-alterne-granada-grito-
-Oye Patxi sabes que dicen que los vascos de cada tres palabras que decimos dos son palabrotas
- Hostias, no jodas!
Y chiste al canto:
- Dicen que un español, de 4 palabras que dice 3 son palabrotas
- ¡Hostia puta! ¿no jodas?
Esas son las 4 menos empleadas.
(by the way: siento el spoiler)
Y si están por orden podemos observar que se dice más "no" que "sí"
Brysbaert & New compiled a new frequency measure on the basis of American subtitles (51 million words in total)
subtlexus.lexique.org/
es.wikipedia.org/wiki/Cifrado_César#Descifrado
Por lo tanto no me parece un estudio concluyente ni digno de tener en cuenta.
en fin, por lo menos tengo la satisfacción de que en España no somos tan malhablados como creía
Porque si sale gobierno y presidente, partido tiene que salir, por la política, por el fútbol y por el participio. ¿O es que no se escribe de deportes?
en breves saco el curso
Todos los extranjeros que viene a españa, aunque hablen español e incluso español nativo (sean hispanoamericanos por ejemplo). Se quedan alucionados con lo que se usa la palabra vale. Es la primiera palabra que aprenden de tanto oirla.
Ademas la palabra "vale" debe ser la palabra con mas significados del mundo. Por que vale para todo.
Vale?
Pues vale.
A modo anecdótico, cabe señalar también que el capo mafioso Bernardo Provenzano, recientemente detenido, utilizaba para comunicarse, en pleno siglo XXI, notas escritas con una máquina de escribir, codificadas mediante este rudimentario algoritmo, renegando de cualquier tecnología nueva como el teléfono móvil o internet. A pesar de lo rudimentario del sistema, ha conseguido tener a la policía despistada durante años.
Un poco de clases de mates y estadística no le vendría mal a la poli
goo.gl/h5WkS
Le he echado un vistazo (no os penseis que me he mirado las 10.000 palabras
goo.gl/rB3gL
y dice que no existe.
¿Alguien me lo explica? Si hay una es probable que haya más que no existan en castellano
Ya podrian haberle pasado el diccionario a la lista
293. luis
364. c
583. b
612. p
700. i
772. psoe
835. g
898. pp
911. ii
971. r
983. j
996. n
1075. york
<- goo.gl/Nio8Z WTF!
1289. the
1337. f
1364. l
1371. v
1539. fig
1590. eta
<- esta pasa pero no me trago que sea una palabra usada por su significado en el diccionario goo.gl/wu4F8
1661. t
1663. ee
1743. h
1771. uu
Quien quiera y tenga tiempo que le pase el corrector al resto
Curiosamente y segun esto... el psoe esta más nombrado que el pp (para bien o para mal)
* hijos de puta
* no les votes
* me la fo...
Además, que esa lista está censurada o sesgada. La palabra "joder" no aparece entre las 10000 más usadas!
Para llegar al 50%, en alemán 207, en español 130 y en inglés 57 (el inglés se estanca en proporción)
de.wikipedia.org/wiki/Liste_der_häufigsten_Wörter_der_deutschen_Spra
¿Cómo será la distribución en chino mandarín?