Saturday, May 23, 2009

Anagrammák a Szexuál-lélektani elmélkedésekben

Kigyűjtöttem az anagrammákat a Szexuál-lélektani elmélkedésekből, a kedvenceimet meg is jelöltem:

adtunk - tudnak
akarok - akkora
akkor - rokka
állat - által
állat - talál
állati - általi
által - talál
áltat - látta
ami - mai
átokról - korától
bajod - dobja
boldogan - dologban
boldognak - dolgokban
csakugyan - ugyancsak
dolgoknak - gondokkal
dörög - ördög
dráma - madár
ebből - előbb
egyet - tegye
ehelyett - helyette
ekörűl - körűle
el - le
elérte - életre
elértem - értelme
elértem - létemre
élet - étel
életnek - keltené
elkövetnek - követelnek
előtt - ettől
elvét - vétel
emellett - mellette
engedi - idegen
ereszt - szeret
Ernő - nőre
erőm - merő
ért - tér
értelme - létemre
eset - este
esett - teste
eszerint - szeretni
eszerint - szerinte
észre - része
ételt - tétel
evett - vette
ezen - zene
fejezet - fejezte
felelet - felelte
feleltem - felemelt
hogyne - nehogy
idegi - ideig
illa - lila
intelem - intelme
járnak - karján
kasztok - szoktak
kegyelet - legyetek
kellek - lelkek
kenik - kinek
kenik - nekik
képlet - léptek
keresni - senkire
kinek - nekik
koráig - orgiák
lánya - nyála
látna - talán
legény - lényeg
léleknek - lelkének
lénynek - nyelnék
már - rám
mende - nemde
meri - mire
néger - régen
rózsa - szóra
sérelem - sérelme
szegény - szégyen
szentek - tesznek
szerelem - szerelme
szeretet - szerette
szeretni - szerinte
szeretnők - szeretőnk
szólva - szóval
terve - verte
tudat - tudta
vájkált - váltják
vegyi - vigye

Ha valakit érdekel, hogy gyűjtöttem ki őket:
Szavakra már eleve szétszedtem a szöveget, hogy meg tudjam csinálni a word-cloudot. A ragozott alakokkal eggyütt nagyjából tízezer különböző szó fordul elő ebben a könyvben, ami nem tűnik soknak. Annyit tettem, hogy egy alkalmas hash-fügvényt próbáltam választani, amivel lehesseltem a szavakat. Az volt a cél a hashfüggvény kiválasztásánál, hogy hogy az anagrammáknak mindenképpen ugyanaz legyen a hash értéke, és a nem anagrammáknak pedig lehetőleg eltérő. A karakterek kódjainak összeadása (arca -> 97+114+99+97 = 407) naív kiindulópontnak jó, de sok volt a hamis egyezés, azaz sok nem-anagramma szónak is ugyanaz lett a hash értéke (pl. basa -> 98+97+115+97 = 407). A karakterkódok négyzetének összegével már jobb lett az eredmény és a karakterkódok köbének az összege már teljesen használhatónak bizonyult. Aki szeretne anagrammákat keresni, annak azért jelzem, hogy ez egy naív hashelés és hosszabb szövegek esetén sok hibát eredményezhet. Ami tényleg jó megoldás, az lerendezni a betűket a szavakban (arca -> aacr) és ezt a rendezett szót használni hash kulcsként.

No comments: