Kotoistus - Merkkikohtaiset tiedot

CLDR versio 1.2
Lokaalit: fi fi_FI

Tälle sivulle on koottu merkit jotka vaativat keskustelua.

Jokaisen merkin kohdalla tulee harkita

  1. exemplarCharacters (merkkiluettelo): exemplarCharacters ehdotettu uusi versio.
  2. Lajittelu: ehdotetut suomalaiset lajittelusäännöt v.2.

MERKKI HEX NIMI
w 0077 latinalainen pienaakkonen w
Lajitellaanko w kuten v vai omana kirjaimenaan v:n jälkeen?
Ehdotamme, että normaalilajittelussa w on samanarvoinen kuin v, lajittuen v:n jälkeen vain jos muita eroja sanoissa ei ole.
Puhelinluettelolajittelussa kirjaimet käsitetään eri kirjaimiksi, eli w lajittuu v:n jälkeen omana kirjaimenaan.
ű 0171 Esim. unkarin pitkä y
Sama koskee unkarin ő (0151) kirjainta.
Ne on määritelty CLDR 1.2:ssa luultavasti lajittelun takia.
Merkkejä ei hyväksytä exemplarCharacters:hin koska ne eivät ole yleisessä käytössä.
Unkarin kaksoisakuutti-u, ű (0171) aakkostuu SFS 4600:n mukaan kuten y.
Unkarin kaksoisakuutti-o, ő (0151) aakkostuu SFS 4600:n mukaan kuten ö.
Kirjaimet jätetään lajitteluun koska ne ovat helposti sotkettavissa ü ja ö kirjaimiin. Jos niitä ei määritellä ne lajittuvat kuten oletussäännöt sanovat (u:n ja o:n jälkeen).
Tämä on poikkeus säännöstämme jonka mukaan vain yleisessä käytössä oleville kirjaimille tulisi määritellä omat lajittelusäännöt.
ā 0101 pitkä a
Sama koskee merkkejä (ō, 014d) ja (ū, 016b).
Lajittelussa oletuslajittelu kelpaa. Se on kuten "a" ja tarkemerkki.
exemplarCharacters kohdalla on kyse siitä tulisiko niitä käyttää tiettyjen japaninkielisten sanojen translitteroinnissa. Pitkä a, o ja u ilmenevät mm. japanilaisien aikakausien nimissä.
Ei ole selvää onko hyväksytty käytäntö käyttää a, o, u kirjaimia näiden tilalla.
On myös epäselvää mikä on yleinen käytäntö.
Päätös on sisällyttää pitkä a, o ja u. Niitä ilmenee myös muissa kielissä. Niiden poistaminen ei parantaisi vaan huonontaisi tekstin ymmärrettävyyttä.
æ 00e6
Koskee myös merkkiä Æ (00c6).
Tanska, norja.
UCA oletus "a".
SFS 4600 sanoo "ae".
Tulisiko lajitella kuten "ae" vai "ä"?
æ mielletään yleisesti ä:nä suomessa joten tämä tulkinta otetaan käyttöön.
œ 0153
Koskee myös merkkiä Œ (0152).
Ranska.
UCA oletus on "oe". Onko "ö" parempi?
SFS 4600 sanoo "oe".
Transliteroidaan ranskaksi "oe".
Mielletäänkö œ ö:ksi vai ligatuuriksi "oe"?
Tulkitaan "oe" ligatuuriksi, eli jätetään UCA oletus.
á 00e1
Koskee myös merkkiä Á (00c1).
Pohjoissaame, inarinsaame.
Tulisiko lajitella kuten "a" vai kuten "ä"?
Ilmenee myös muissa kielissä. Selkein käytäntö on lajitella kuten "a". Jätetään UCA oletuslajittelu.


* * * * *