Palabras aleatorias

Probabilidad e inglés … ¡qué mezcla!
 

Letras aleatorias

Pensarías que es fácil crear palabras aleatorias … solo elige letras al azar y júntalas, ¡y listo! Una palabra al azar.

Bueno, aquí hay 20 palabras hechas de esa manera:

tldkl oewkx dmwol vuptg hvwjk naqid avypr zwtip zgnzs bvdhd
muyfd ighgd xhlng oyecn vjnsl ssjrx gxald tukxj rvfoq yxzxq

¡Resulta que las palabras no son solo tonterías, sino bastante difíciles de pronunciar!

(Intenta decir “ tldkl ” o “ oewkx “)

Verás, la probabilidad es muy improbable … tendrías que probar muchas combinaciones aleatorias antes de tener suerte.

¿Por qué? Bueno, el inglés tiene alrededor de 200,000 palabras (228,000 en el Oxford English Dictionary incluyendo muchas palabras que ya no se usan) … pero ¿cuántas palabras diferentes se pueden formar con solo 5 letras?

26 × 26 × 26 × 26 × 26 = 11,881,376 ¡5 palabras posibles!

Y esas son solo las palabras de 5 letras …

Supongamos que hay 40,000 palabras en inglés que tienen 5 letras. Entonces, la probabilidad de hacer una palabra real solo al azar sería:

40,000 / 11,881,376 = 0.003, o aproximadamente 0.3% de probabilidad

Entonces las palabras reales son raras . Y podemos ver que juntar letras al azar es muy poco probable que produzca una palabra real.

Vocales

Podemos mejorar nuestro éxito al insistir en que una palabra tenga al menos una vocal, ya que casi todas las palabras en inglés tienen una (excepto fly , por y algunas otras). Así:

ectot gjaqv kuifg vzicu zspsu pdidb wqdis uerrs ucgej okimw
fnevz ewxko ljgew aglgo jpfoq dcytu uwkcj dzioy wekdx xuybk

Esta es una gran mejora. Se pueden pronunciar más palabras.

Pero todavía hay muchas palabras extrañas como “ zspsu ” y “ xuybk

Frecuencia de letras

Entonces, nuestra próxima mejora es usar menos de las letras como j, x, z y q y más de las letras como e, ty s.

De hecho, la frecuencia de letras en el idioma inglés es bien conocida. A continuación, le indicamos cuántas veces esperaría ver una letra por cada 1,000 letras:

a b c d e f g h i j k l m n o p q r s t u v w x y z
82 15 28 42 127 22 20 61 70 2 8 40 24 67 75 19 1 60 63 90 27 10 24 2 20 1

¿Puedes ver que “e” es común, pero “z” es raro?

  • “e” es probable que ocurra 127 veces por cada 1,000, o como una relación 127/1000 = .127 (= 12.7%)
  • “z” es probable que ocurra solo 1 vez por cada 1,000, o como una proporción 1/1000 = .001 (= 0.1%)

Entonces, al seleccionar letras basadas en esa frecuencia (un poco como tirar un dado de 19 caras (dados) , donde cada dado tiene 82 a ‘s, 15 b ‘s … y solo uno z ), podemos obtener resultados como este:

elnao etgov segty últimamente aessn siuon oenha eaoas ncoot ctwka
dmswo dpuoh eewis ebdni laarm syucs idvos lhina igahh soyie

Todavía no hay palabras reales, pero algunas están cerca. Y la mayoría de ellos se pueden pronunciar. (¡Grandes nombres si estás escribiendo una novela de ciencia ficción!)

¡Pruébalo por ti mismo!

Puedes probar los tres métodos aquí … ver si puedes tener suerte y encontrar una palabra real:

 

 

pero podemos hacerlo mejor …

Frecuencias de 2 letras

Podemos llevar la idea de la frecuencia de letras un paso más allá al preguntar

“¿Cuál es la frecuencia de las letras que siguen otra letra”

Por ejemplo, si ya tenemos una “t”, la siguiente letra es muy probablemente para ser una “h” (haciendo “th”).

Para ilustrar esto, construí una Tabla de frecuencias de dos letras (de Alicia en el país de las maravillas ). Aquí está la línea para “t”:

Frecuencia a b c d e f g h i j k l m n o p q r s t u v w x y z
t 238 41 727 11 3197 459 275 18 12 990 149 153 333 125 65 54

Entonces, “h” ocurrió 3197 veces después de una “t” (“th”) … pero “b” nunca siguió a una “t”

OK, comencemos con una “t”, y digamos que elegimos una “h” para hacer “th”, luego usaremos la “h” -row para elegir otra letra (tal vez una “e” “hacer” el “), y así sucesivamente … bueno, aquí hay una muestra:

el cur the bund hof arytowno d sheromasees asemedosouro f
soacthake d imon binofowat oaten d heng wa

Los resultados son notables … sin sentido, pero casi como un lenguaje extraño.

De hecho, no solo estamos haciendo palabras al azar ahora, ¡estamos haciendo oraciones al azar !

Mayores frecuencias de letras

¿Por qué parar allí? Podemos hacer tablas de frecuencias de tres letras o más …

Frecuencias de 3 letras

¿Cómo funcionan las frecuencias de 3 letras?

Bueno, digamos que ya tengo dos letras (como “ei”) … entonces:

  • mira el texto de muestra cada vez que aparece “ei”,
  • elige aleatoriamente uno de esos
  • busca la letra que sigue a “ei” (posiblemente “t”).
  • luego agrega la “t” para hacer “eit”
  • y comience de nuevo usando “it” (… siempre las dos últimas letras)

Aquí hay una muestra:

Cualquiera de los dos puede llegar a ser muy profundo y
Wondere comenzó en el libro sobre escuchar!

Ahora, ese se ve bien! Al tomar muestras de una fuente real podemos obtener buenos resultados.

Frecuencias de 4 letras

Utilizando el mismo método, utilicé grupos de 3 letras para decidir sobre la cuarta letra y obtuve:

O los lados o las conversaciones a tiempo para
sucede a continuación. Primero, ella mira hacia abajo

Frecuencias de 5 letras

Y con frecuencias de 5 letras:

Justo a tiempo todo parecía bastante natural);
pero para tomarse el tiempo que no le gustaba hacer

¡Pruébalo por ti mismo!

Sí, escribí algo para que juegues. Tiene los primeros 6 párrafos de Alicia en el país de las maravillas ), pero puedes poner tu propio texto fuente allí .

Encuentra algo de Shakespeare, o un discurso político y mira qué ocurre … incluso podrías combinar citas de diferentes autores para ver lo que sus hijos podrían escribir.