KESKUSTELUT > RISTIKOT > RISTIKON RUODINTA TUNNUSLUKUJEN VALOSSA

9895. Ristikon ruodinta tunnuslukujen valossa

iso S29.10.2021 klo 17:19
Sain kimmokkeen tähän yhteensattuman kautta. Säikeessä 9884. IS Viikonloppu 23.-24.10.2021 esitettiin kysymys "Onkohan jossakin julkisesti olemassa jotakin ristikkotermistöä ja laskukaavoja, joilla ristikon rakennetta määritellään?" ja olin juuri ratkaissut mielestäni erinomaisen ristikon, joka olisi sopiva mittatikku muille ristikoille. Mieleeni tuli useita mahdollisia tunnuslukuja, jotka enemmän tai vähemmän kuvaavat ristikon rakennetta, luonnetta ja osittain laatuakin. Tärkein laadun määrittelijä on tietysti ratkojan elämys, johon mitattavissa olevia asioita enemmän vaikuttaa sanaston ja vihjeiden laatu.

Tässä mieleeni tulleita mittareita. Jos joku keksii lisää niin aina parempi, tai ainakin runsaampi.

Yleisin mittari on varmaan sanojen keskipituus, joka on periaatteessa helposti laskettavissa: sanojen pituuksien summa jaettuna sanojen lukumäärällä. Vähemmällä työllä selviää (ei tarvitse välittää sanojen pituuksista kun käyttää kaavaa (2 * vastausruutujen määrä - piilokirjainten määrä) / sanojen määrä. Huom: kaikkien piilokirjainten noteeraaminen vaatii yllättävän paljon tarkkaavaisuutta!

Piilokirjainten prosenttiosuus kaikista kirjaimista kertoo ristikon sokkeloisuudesta ja laatijan paneutumisesta. Pienempi on parempi, ihanne nolla.

Ristikon sanojen pituuden jakauma kertoo myös laatijan kyvystä ja halusta tehdä minimiä parempaa laatua. Voi laskea esimerkiksi nelikirjaimisten ja yli kuusikirjaimisten sanojen osuuden kaikista sanoista.

Kirjainvalikoimaa ei sovi unohtaa. Kuinka monta erilaista kirjainta ristikosta löytyy ja miten niiden määrät jakautuvat? Käytetäänkö kohtuuttoman paljon laadinnallisesti helppoja kirjaimia?

Kuinka iso osa sanoista on monikkomuodossa? Etenkin oikeanpuoleisimmalla sarakkeella ja alarivillä helposti t-kirjainten määrä korostuu, koska on helppo keksiä t-loppuisia sanoja monikon avulla. Ratkojan kannalta se on hiukan tylsää.

Ristikossa olevat aukiot ja niihin johtavien reittien määrä kertoo myös laatijan tasosta. Oikeassa alanurkassa on oltava vähintään 4*4-aukio (ellei laatija ole sijoittanut pääkuvaa sinne). Muissa kulmissa ja muualla ristikossa ei tarvitse välttämättä olla edes tuon kokoisia aukioita, mutta onhan se hyvä saada ristikkoon vähän avaruutta, onhan? Jättiaukiot kertovat joko laatijan suuresta taidosta tai suuruudenhulluudesta. Eron huomaa sanaston laadusta.

Hyvässä aukiossa on vähintää kaksi "reikää". Jos sisään pääsee vain yhden sanan kautta, ratkojalla ei ole mitään mahdollisuutta päästä vyöryttäytymään aukion sisään jos juuri tuo sana sattuu olemaan oman osaamisalueen ulkopuolella. Ristikon perusolemukseen kuuluu että poikittaisista sanoista saa apua. Tietokilpailut ovat erikseen.
2. iso S29.10.2021 klo 17:21
Alussa mainitsemani ristikko on Juha Leinosen hyvillä sanoilla laatima erisnimetön aukeama. Lähtökohta asettaa melkoisen rajoitteen, jonka olettaisi näkyvän ristikon tunnusluvuissa. Ristikko on julkaistu syksyllä 2020. Vertaan sitä viimeiseksi jääneeseen julkaisemattomaan omaan ristikkooni, jonka laatimisessa ei ollut muita lähtökohtaisia rajoittimia kuin minä itse. Omat lukemani suluissa.

Ristikon koko: 22*34 (22*16). 566 sanaruutua (239)
188 sanaa, keskipituus 5,793 (80, 5,625 - useimmiten minulla välillä 5,2-5,4)
27 piilokirjainta vaakasanoissa (11), 16 pystysanoissa (17)
kirjaimista 7,60 % piilokirjaimia (11,72 %)
23,4 % sanoista monikkomuotoisia (30,0 %)
Pääkuvan ja reunakaistojen ulkopuolisten vihjealueiden keskikoko 1,10 ruutua (1,67)
Kulmissa olevien aukioiden koko 4*9, 6*4, 4*5, 5*4 (5*5, 4*5, 4*4, 4*4)
Niihin johtavien reittien määrä: 2, 5, 5, 5 (3, 4, 4, 2)
Muut vähintään 4*4 aukiot: 5 kpl 4*4 (2 kpl 5*4, 2 kpl 4*4)
Niihin johtavien reittien määrä: 7, 7, 7, 6, 4 (5, 3, 4, 3)

Sanojen pituusjakauma:
4: 52, 27,66 % (36, 45,00 %)
5: 43, 22,87 % (17, 21,25 %)
6: 37, 19,68 % (8, 10,00 %)
7: 27, 14,36 % 4, 5,00 %)
8: 18, 9,57 % (2, 2,50 %)
9: 6, 3,19 % (4, 5,00 %)
10: 0, 0,00 % (8, 10,00 %)
11: 4, 2,13 % (0, 0,00 %)
13: 1, 0,53 % (1, 1,25 %)

Kirjainjakauma:
A: 14,49% (17,99 %)
D: 0,18% (0,00 %)
E: 7,77% (6,28 %)
H: 1,41% (0,42 %)
I: 10,95% (10,04 %)
J: 0,71% (0,00 %)
K: 3,89% (4,18 %)
L: 5,48% (5,44 %)
M: 2,30% (2,09 %)
N: 3,89% (2,93 %)
O: 7,42% (8,37 %)
P: 2,65% (2,51 %)
R: 2,65% (4,18 %)
S: 8,48% (8,37 %)
T: 16,08% (16,32 %)
U: 7,24% (7,95 %)
V: 1,24% (1,67 %)
Y: 0,88% (0,42 %)
Ä: 2,30% (0,42 %)
Ö: 0,00% (0,42 %)

Tein parhaani ja katsoin mihin se riittää eikä se mihinkään riittänyt. Kuten sanottu, Juhan sanastokin oli priimaa ja silti numerot ovat minun kannaltani karua luettavaa. Guru löi hurun kaikilla rintamilla.
3. ++juh29.10.2021 klo 19:13
Laskithan kirjainjakauman ratkaisusanoista, jolloin piilokirjaimet painottuvat oikein.

Onko tässä siis neljä hyvää aukiota?
http://ristikkotuumin.fi/tmp/aukiot.png
4. Jukkis29.10.2021 klo 20:38
Yksi tunnusluku on erisnimien määrä. Mitä vähemmän, sitä parempi, noin niinkun yleissääntönä.
5. Jaska29.10.2021 klo 22:38
Noin pienessä ristikossa neljä 4x4-kulma-aukiota on tietysti sinänsä hyvä asia. Mutta kun yhteen on vain yksi väylä, on esimerkki teknisesti epäonnistunut.
6. iso S30.10.2021 klo 16:04
++juh: laskin jakauman ristikossa esiintyvistä kirjaimista enkä ymmärrä, miksi ratkaisusanoista laskeminen olisi enemmän oikein ja miksi ristikon kirjainjakaumaa laskettaessa pitäisi piilokirjaimia jotenkin painottaa. Kun ratkot ristikkoa, kirjoitat piilokirjaimen kerran ja sanojen risteyksessä olevan kirjaimen kerran. Joku tunari tietysti kumittaa ja kirjoittaa useat kirjaimet useaan kertaan, olivatpa ne piilokirjaimia tai ei, mutta se ei muuta ristikossa olevien kirjainten määrää.

Kirjainten lukumäärä muuttuu tietysti oleellisesti ja prosenttijakauma jonkin verran, jos jakauma lasketaan ratkaisusanoista, mutta silloin mitataankin eri asiaa. Kryptoissa tämä on huomioitu säännöissä: jos kirjain esiintyy kryptossa, sen täytyy oikeaoppisessa kryptossa esiintyä vähintään kahdesti ja vain toinen näistä esiintymistä saa olla piilokirjain. Sanoista laskien esiintymiä on siis vähintään kolme, ja neljä jos kumpikaan ei ole piilokirjain. Sääntöä ei kuitenkaan ole kirjoitettu tuon minimimäärän mukaan, koska käsittääkseni se ei riitä, että kirjain esiintyy vähintään kolme kertaa, mutta kaikki esiintymät ovat piiloja.

Esimerkkipohjassa on mielestäni yksi hyvä aukio, kaksi tyydyttävää aukiota ja yksi näennäisesti tyydyttävä aukio, oikea yläkulma. Siihen kyllä pääsee kahta reittiä, mutta yhteys muihin aukioihin kulkee silti vain yhden ruudun kautta,

Jos aukion sivun minimimimitaksi määritellään 4 ruutua, niin tuossa esimerkkipohjassa on neljä aukiota, joissa on yhteensä 64 vastausruutua. Muita vastausruutuja on 16, eli yhteensä 80 ruutua. Jos aukioihin kuuluvienruutujen määrää merkitään kirjaimella A ja vastausruutujen kokonaismäärä kirjaimella K, yksi tapa määritellä ristikon aukioisuusaste prosenttilukuna on 100 *A/K. Tässä esimerkissä tuo tunnusluku on korkea, 80 %. Jos kahden oikeanpuoleisen aukion välillä puhkaistaan yksi yhteys, aukioisuusaste on 100*64/81 eli 79 %. Tunnusluku kärsisi hieman, mutta kahden aukion ja koko ristikon rakenne paranisi oleellisesti. Esimerkki on oikein hyvä osoittamaan, että yksi tunnusluku ei kerro koko totuutta ja yhden tunnusluvun maksimoiminen ei takaa parasta mahdollista tulosta. Kohtuus kaikessa ja kokonaisuus ratkaisee.

Eri asia on se, miten aukio määritellään. 4*4 on varmasti aukio, mutta eiköhän joku 3*10 myös näytä aukiolta? onhan sen pinta-ala melkein kaksinkertainen, vaikka siihen ei toiseen suuntaan mahdukaan minimimittainen sana.

Jukkis: kyllä, erisnimien määrä on ihan hyvä mittari. Sen voi tietysti jakaa vielä alalajeihin: etunimi, sukunimi, paikannimi, tuotenimi ja niin edelleen. Ylenpalttinen määrä erisnimiä on huono juttu, paitsi silloin jos ristikko on teemaristikko ja nimeltään erisnimellinen. Silloin enemmän on parempi. Tämäkään mittari ei aina kerro totuutta. Erisnimien laatukin vaikuttaa. Juhan ristikko oli nimeltään erisnimetön ja erisnimien määrä oli nimeä totellen nolla. Minulla erisnimiä oli 7 eli 8,75 prosenttia sanoista.

Erisnimien laskeminen on jossain määrin pulmallista. Juhan ristikossa oli yksi pulmallinen sana, Stilton. Sen voi tulkita juuston nimeksi tai juuston tyypiksi. Kielitoimiston sanakirja kirjoittaa sen pienellä kirjalla. Juhaa on aika vaikea saada kiinni virheestä. Minun ristikossani on toinen esimerkiksi kelpaava sana, Ilkat. Laskin sen erisnimen monikoksi, vaikka Nykysuomen sanakirja tuntee substantiivina sanat ilkka ja ilka. Eikohän useimmat kuitenkin miellä tuon sanan erisnimeksi. Aika monella nimellähän on myös konkreettinen merkitys: Taru kertoo, että Vieno Tuuli kaatoi Viljan.
7. iso S5.11.2021 klo 16:56
Edellisessä viestissä heitin näppituntumalta arvion, että kirjainten prosenttijakauma muuttuu jonkin verran, jos jakauma lasketaan ratkaisusanoista" verrattuna siihen että se lasketaan ristikon kirjaimista. Oletukseni oli että muutos ei ole kovin suuri. No, tässä on vierekkäin Juhan ristikon jakaumat. Ensimmäinen prosenttiluku on laskettu ristikon kirjaimista, toinen sanojen kirjaimista.

A: 14,488, 14,876
D: 0,177, 0,184
E: 7,951, 7,713
H: 1,413, 1,377
I: 10,954, 11,203
J: 0,707, 0,643
K: 3,887, 3,765
L: 5,477, 5,510
M: 2,297, 2,204
N: 3,887, 3,857
O: 7,420, 7,346
P: 2,650, 2,663
R: 2,473, 2,571
S: 8,481, 8,632
T: 16,078, 16,070
U: 7,244, 7,163
V: 1,237, 1,194
Y: 0,883, 0,826
Ä: 2,297, 2,204

Suurin ero on A-kirjaimessa, 0,388 prosenttiyksikköä. Tulokset ovat aika vahvasti samansuuntaisia ja molemmilla tavoilla A on toiseksi yleinen kirjain turvallisella marginaalilla. Periaatteessa on tietysti olennainen ero sillä mitä halutaan mitata, vaikka käytännön erot jäivät pieniksi.

Laskentatapa pääsi hieman vaikuttamaan kirjainten yleisyysjärjestykseen. Ristikon kirjaimista laskettuna K ja N olivat tasoissa (22-22), sanojen kirjaimista laskien N kiri yhdellä edelle (42-41). Muiden järjestys oli sama.
8. Jaska5.11.2021 klo 17:24
Ratkaisusanojen kirjainmäärän laskeminen on OK sanojen keskipituuden selvittämiseksi. Kirjainten absoluuttinen kokonaismäärä on puolestaam ruutujen kokonaismäärä miinus ruudukon sisällä olevien vihjeruutujen lukumäärä. Niinpä kryptossakaan ei kirjain z esiiinny kolme kertaa, kun se esiintyy yhdessä piiloruudussa ja yhdessä risteävässä ruudussa. Kryptossa on siis tällöin kaksi z-kirjainta.
9. iso S6.11.2021 klo 12:35
Niin on kun siltä näyttää, mutta ++juh on siinä oikeassa, että tuon kaksi z-kirjainta sisältävän krypton ratkaisusanoissa on kolme z-kirjainta. Krypton ratkaisua yrittäneen yllä saattaa leijua lisää z-kirjaimia, mutta niitä ei lasketa.

Kehitin ristikon aukioisuuden mittaamiseen laskentakaavan, joka on manuaalisesti laskettuna työläs, mutta sitä vartenhan on koneet olemassa. Lasketaan jokaisesta ristikon ratkaisuruudusta (kirjainruudusta) kuinka monta ratkaisuruutua on siitä yhteensä vasemmalle, oikealle, ylös ja alas ja näistä keskiarvo. Tämä on helposti ohjelmoitavissa. Kahden sanan risteyksestä kertyy pisteitä sanojen yhteispituus vähennettynä kahdella, piilokirjaimista sanan pituus vähennettynä yhdellä, jos haluaa itse laskea.

Kaava testaaminen ja tuloksen vertaaminen silmällä nähtyyn kertoo, että näin saadulle tunnusluvulle pitäisi antaa nimeksi pikemminkin avoimuus tai hengittävyys kuin aukioisuus, eli se mittaa sitä kuinka monen ruudun kautta kuhunkin ruutuun keskimäärin voi saada apua. Leinosen hyvin väljä ristikko saa arvon 25,55, minun melko lokeromainen ristikkoni 16,27 ja ++juh:in hyvinkin aukioinen mutta erittäin lokeroinen ristikko 9,70.

Muuten, ristikon rakenteen mittaamisesta ja hyvyyden arvioimisesta on keskusteltu jo aikojen alussa, vuonna 2003 säikeessä 271. Arvosteluasteikko ? eli
http://www.sanaristikot.net/keskustelut/?id=271
KOMMENTOI

Pakolliset kentät merkitty tähdellä *