User:Benwing2/test-th-translit

  1. translit: ฿
  2. ไปอยู่ไหนมา (bpai )
  3. เจ้าลูกหมูส่งเสียงร้อง “อู๊ด อู๊ด” ดังลั่น
  4. [[Unsupported titles/ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก`lsqb`แมนเช็สเตอร์/แมน-เช็ส-เตอ`rsqb` ขอโทษครับ คุณชื่ออะไรครับ#Thai|ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก[แมนเช็สเตอร์/แมน-เช็ส-เตอ] ขอโทษครับ คุณชื่ออะไรครับ]]

Batch 1 edit

See below the same sentences with outputs listed in the same other using {{th-xi}}

  1. สวัสดี ค่ะ คุณ ชื่อ อะไร คะ
  2. สวัสดีค่ะ คุณชื่ออะไรคะ
  3. translit: sà-wàt-dii kâ • kun chʉ̂ʉ à-rai ká
  4. makeEntryName: สวัสดีค่ะ คุณชื่ออะไรคะ
  5. preprocessLinks: สวัสดีค่ะ คุณชื่ออะไรคะ
  6. ชื่อ ปีเตอร์ ครับ
  7. ชื่อปีเตอร์ครับ
  8. translit: chʉ̂ʉ bpii-dtə̂ə kráp
  9. makeEntryName: ชื่อปีเตอร์ครับ
  10. preprocessLinks: ชื่อปีเตอร์ครับ
  11. คุณ ปีเตอร์ เป็น คน อเมริกัน ใช่ ไหม คะ
  12. คุณปีเตอร์เป็นคนอเมริกันใช่ไหมคะ
  13. translit: kun bpii-dtə̂ə bpen kon à-mee-rí-gan châi mǎi ká
  14. makeEntryName: คุณปีเตอร์เป็นคนอเมริกันใช่ไหมคะ
  15. preprocessLinks: คุณปีเตอร์เป็นคนอเมริกันใช่ไหมคะ
  16. [[Unsupported titles/ไม่ ใช่ ครับ เป็น คน อังกฤษ ครับ มา จาก `lsqb`แมนเช็สเตอร์/แมน-เช็ส-เตอ`rsqb` ขอโทษ ครับ คุณ ชื่อ อะไร ครับ#Thai|ไม่ ใช่ ครับ เป็น คน อังกฤษ ครับ มา จาก [แมนเช็สเตอร์/แมน-เช็ส-เตอ] ขอโทษ ครับ คุณ ชื่อ อะไร ครับ]]
  17. [[Unsupported titles/ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก`lsqb`แมนเช็สเตอร์/แมน-เช็ส-เตอ`rsqb` ขอโทษครับ คุณชื่ออะไรครับ#Thai|ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก[แมนเช็สเตอร์/แมน-เช็ส-เตอ] ขอโทษครับ คุณชื่ออะไรครับ]]
  18. translit: mâi châi kráp • bpen kon ang-grìt kráp • maa jàak [แมนเช็สเตอร์/mɛɛn-chés-dtəə] • kɔ̌ɔ-tôot kráp • kun chʉ̂ʉ à-rai kráp
  19. makeEntryName: ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก[แมนเช็สเตอร์/แมน-เช็ส-เตอ] ขอโทษครับ คุณชื่ออะไรครับ
  20. preprocessLinks: ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจาก[[[แมนเช็สเตอร์]]/แมน-เช็ส-เตอ] ขอโทษครับ คุณชื่ออะไรครับ
    1. {{m|th|[แมนเช็สเตอร์/แมน-เช็ส-เตอ]}} is a link to an undefined term with a respelling. The expected transliteration is "mɛɛn-chés-dtəə" (Manchester) (may not be 100% accurate or there could be respelling variants with loanwords)
    2. translit: [แมนเช็สเตอร์/mɛɛn-chés-dtəə]
    3. makeEntryName: [แมนเช็สเตอร์/แมน-เช็ส-เตอ]
    4. preprocessLinks: [[[แมนเช็สเตอร์]]/แมน-เช็ส-เตอ]

Cases with (WIP)

  1. จอด ใกล้ ๆ สี่แยก ได้ ไหม คะ
  2. จอดใกล้ ๆ สี่แยกได้ไหมคะ
  3. translit: jɔ̀ɔt glâi • glâi • sìi-yɛ̂ɛk dâai mǎi ká
  4. makeEntryName: จอดใกล้ ๆ สี่แยกได้ไหมคะ
  5. preprocessLinks: จอดใกล้ สี่แยกได้ไหมคะ
  6. ไป แล้ว [ๆ/ไป แล้ว] (this is impossible to demonstrate with the current Thai templates, it needs to reduplicate more than just the last word). The Thai spelling and transliteration should be ไปแล้ว (bpai lɛ́ɛo · bpai lɛ́ɛo). (A Thai reader will know that they have to reduplicate two last words, not just the last one).
  7. ไปแล้ว[ๆ/ไปแล้ว]
  8. translit: bpai lɛ́ɛo [lɛ́ɛo/bpai lɛ́ɛo]
  9. makeEntryName: ไปแล้ว[ๆ/ไปแล้ว]
  10. preprocessLinks: ไปแล้ว[[[ๆ]]/ไปแล้ว]

Notes edit

  • Two spaces produce · (space + middle point + space) or an actual visible space in the translit (to be confirmed)
  • "{/}" is used for native Thai respellings. Syllables are separated with a "-" (hyphen). The new method for respellings to be used is going to be "[/]"

Examples of how {{th-xi}} handles these with correct transliterations, links and spacing edit

Literal or semi-literal translations are not tested, only given to help to understand

  1. สวัสดีค่ะ คุณชื่ออะไรคะ  ―  sà-wàt-dii kâ · kun chʉ̂ʉ à-rai ká  ―  Hello. What's your name (female speaker)
  2. sà-wàt-dii kâ • kun chʉ̂ʉ à-rai ká
  3. ชื่อปีเตอร์ครับ  ―  chʉ̂ʉ bpii-dtə̂ə kráp  ―  My name is Peter
  4. คุณปีเตอร์เป็นคนอเมริกันใช่ไหมคะ  ―  kun bpii-dtə̂ə bpen kon à-mee-rí-gan châi mǎi ká  ―  Are you are American, (Mr) Peter?
  5. ไม่ใช่ครับ เป็นคนอังกฤษครับ มาจากแมนเช็สเตอร์ ขอโทษครับ คุณชื่ออะไรครับ  ―  mâi châi kráp · bpen kon ang-grìt kráp · maa jàak mɛɛn-chés-dtəə · kɔ̌ɔ-tôot kráp · kun chʉ̂ʉ à-rai kráp  ―  No. I am British. Come from Manchester. Excuse me. What's your name?

Cases with (WIP)

  1. จอดใกล้ สี่แยกได้ไหมคะ  ―  jɔ̀ɔt glâi · glâi · sìi-yɛ̂ɛk dâai mǎi ká  ―  Can you park near the intersection? (female speaker)
  2. The case with multiword reduplication doesn't work correctly: the correct Thai spelling with incorrect transliteration: ไปแล้ว (bpai lɛ́ɛo · lɛ́ɛo) (two words ไป แล้ว are to be reduplicated, not one), the incorrect Thai spelling with correct transliteration ไปแล้ว ไปแล้ว(bpai lɛ́ɛo · bpai lɛ́ɛo).

Batch 2 edit

  1. เขา ชื่อ อะไร ครับ - เขาชื่ออะไรครับ  ―  kǎo chʉ̂ʉ à-rai kráp  ―  What's his name? (male speaker)
  2. ชื่อ ปีเตอร์ ค่ะ - ชื่อปีเตอร์ค่ะ  ―  chʉ̂ʉ bpii-dtə̂ə kâ  ―  (His) name is Peter. (female speaker)
  3. นามสกุล อะไร - นามสกุลอะไร  ―  naam-sà-gun à-rai  ―  What's (his) last name?
  4. นามสกุล [กรีน/กฺรีน] ค่ะ (naam-sà-gun[griin/griin]kâ) - นามสกุลกรีนค่ะ  ―  naam-sà-gun griin kâ  ―  (His) last name is Green. (In my opinion, unrespelled กรีน (griin) or กรีน(griin) should produce NIL as ambiguous.)
  5. เป็น คน ชาติ อะไร ครับ - เป็นคนชาติอะไรครับ  ―  bpen kon châat à-rai kráp  ―  What nationality is (he)?
  6. เป็น คน อังกฤษ ค่ะ - เป็นคนอังกฤษค่ะ  ―  bpen kon ang-grìt kâ  ―  (He) is a British (English) person
  7. คน อังกฤษ ใช่ ไหม - คนอังกฤษใช่ไหม  ―  kon ang-grìt châi mǎi  ―  A British (English) person?
  8. ใช่ ค่ะ (châi kâ) - ใช่ค่ะ  ―  châi kâ  ―  Yes
  9. ทำ งาน อะไร - ทำงานอะไร  ―  tam ngaan à-rai  ―  What does (he) do?
  10. เป็น นัก ธุรกิจ ค่ะ ทำ งาน กับ บริษัท เอ ไอ จี - เป็นนักธุรกิจค่ะ ทำงานกับบริษัทเอ ไอ จี  ―  bpen nák tú-rá-gìt kâ · tam ngaan gàp bɔɔ-rí-sàt ee · ai · jii  ―  (He) is a businessman. Works with (for) company (called) AIG.
  • Note that {{th-x}} can handle กรีน (griin, Green (surname)) without a respelling as with many monosyllabic words and guesses a lack of a vowel (consonant cluster "gr") but it's better to respell it as กฺรีน with the symbol ◌ฺ (phinthu) to avoid ambiguity. Ambiguous cases should produce NIL.

Some special cases edit

  1. ฿ (bàat)
  2. translit: ฿
  3. preprocessLinks: ฿
  4. ๕๐๐ (500)
  5. translit: 500
  6. preprocessLinks: ๕๐๐
  7. 500 (500)
  8. translit: 500
  9. preprocessLinks: 500
  10. กรุงเทพฯ (grung-têep)
  11. translit: grung-têep
  12. preprocessLinks: กรุงเทพฯ
  13. translit: ๏
  14. preprocessLinks: ๏
  15. translit: ๛
  16. preprocessLinks: ๛
  17. กรีน (griin)
  18. translit: griin
  19. preprocessLinks: กรีน
  20. ไปอยู่ไหนมา (bpai )
  21. translit: bpai yùu nǎi maa
  22. preprocessLinks: ไปอยู่ไหนมา
  23. เจ้าลูกหมูส่งเสียงร้อง “อู๊ด อู๊ด” ดังลั่น
  24. translit: jâao lûuk mǔu sòng sǐiang rɔ́ɔng • “úut • úut” • dang lân
  25. preprocessLinks: เจ้าลูกหมูส่งเสียงร้องอู๊ด อู๊ดดังลั่น

Some special cases edit

  1. ฿ (bàat) should be ฿ (฿)
  2. Thai and Arabic numerals: ๕๐๐ (500) should be ๕๐๐ (500) and 500 (500) should be 500 (500). Working fine. ✅
  3. กรุงเทพฯ (grung-têep) to be discussed if it should กรุงเทพฯ (grung-têep~) (and change the respelling in the entry) or leave the same as กรุงเทพ (grung-têep), i.e. "grung-têep"
  4. To decide if various Thai punctuation symbols, e.g. , should produce nothing, copy as they are (i.e. ๏ = ๏) or have a symbol/respelling assigned to them.
  5. กรีน (griin) with a possible true cluster should give no transliteration - กรีน or demand respelling in usage examples. e.g. The word ... was not romanised successfully. Please supply its syllabified phonetic respelling .... The first consonant in a cluster, should be followed by ◌ฺ. The expected output for กรีน (griin) should be NILL (ambiguous), even if it looks like a true cluster. See more on เพลา (pee-laa) vs เพลา (plao) below.
    • On Thai consonant clusters:
    1. True clusters are made of: (gɔɔ), (kɔ̌ɔ), (kɔɔ), (dtɔɔ), (bpɔɔ), (pɔ̌ɔ), (pɔɔ) + one of the sonorants: (rɔɔ), (lɔɔ), (wɔɔ). E.g. ใกล้ (glâi) should be respelled as ไกฺล้ (spelled as ai+g+phinthu+l+mai tho). If a syllable starts with consonants without a vowel or phinthu, it should be deemed suspicious and produce NIL or require a respelling. An example where lack of a respelling may produce false positives (these terms should ideally be always respelled by editors using them):
      1. เพลา respelled as เพ-ลา is transliterated as "pee-laa"
      2. เพลา respelled as เพฺลา is transliterated as "plao"
    2. Letter (hɔ̌ɔ) and in a very few cases (about four words?) + sonorant consonants acts as tone changing marker, e.g. หนาว (nǎao) is respelled as หฺนาว. phinthu marks that letter (hɔ̌ɔ) is not pronounced separately but acts to change the tone, compare the reading produced without the initial (hɔ̌ɔ): นาว (naao). Words where letter (ɔɔ) acts as (hɔ̌ɔ), e.g. อยู่ (yùu) are respelled with like this หฺยู่.
    3. Non-cluster example: สนุก (sà-nùk). (sɔ̌ɔ) and (nɔɔ) can't form a cluster (see rule #1), so there must be a vowel between them. The respelling is สะ-หฺนุก. All such cases are respelled with a vowel (which may be also inherent) These include words with inherent vowels, where no cluster occurs: รส (rót), ผล (pǒn). The initial consonant and the vowel normally don't require respellings if pronounced as spelled.
    4. False clusters: numerous loanwords from Sanskrit and other languages where two consonants are pronounced as one เสร็จ (sèt) (s+r=s), จริง (jing) (j+r=j). They are all respelled.
  6. Boldface word example: ไป อยู่ ไหน มาWhere have [you] been? should be as ไปอยู่ไหนมา  ―  bpai yùu nǎi maa  ―  Where have [you] been?
  7. Quotation marks example: เจ้า ลูก หมู ส่ง เสียง ร้อง “อู๊ด อู๊ด” ดัง ลั่น should be as เจ้าลูกหมูส่งเสียงร้องอู๊ด อู๊ดดังลั่น  ―  jâao lûuk mǔu sòng sǐiang rɔ́ɔng · “úut · úut” · dang lân  ―  The piglet made a loud "Oink, oink" sound.