Apr 10, 2018

ÂM VỊ TIẾNG VIỆT - Bài khảo cứu của Giáo sư Đoàn Văn Phi Long



Lời giới thiệu : Giáo Sư Đoàn văn Phi Long là giáo sư dạy Toán tại trường Trưng Vương trước 1975. Sau khi định cư tại Úc song song với việc dạy Toán cho nhiều thế hệ học sinh Việt tại gia, từ năm 1987 Thầy còn bỏ nhiều thời gian để nghiên cứu về Nguồn gốc dân tộc Việt Nam. Đây là một chương trong khoảng 30 chương của " Nguồn gốc dân tộc Việt Nam". 

Đặc san TV6370 xin cám ơn Thầy Đoàn văn Phi Long đã gửi bài cho, và xin trân trọng giới thiệu đến các bạn TV và độc giả khắp mọi nơi .



ÂM VỊ TIẾNG VIỆT

Gs.Đoàn Văn Phi Long


Một trong những phương cách hữu hiệu để tìm nguồn gốc tiếng Việt là xác định được ngữ hệ và các cấu tạo cơ bản của tiếng Việt. Các công trình nghiên cứu tiếng Việt từ xưa chỉ trông cậy vào các học giả Tây phương, nhưng hiện nay họ ít nghiên cứu tiếng Việt vì có thể họ cho rằng người Việt có đầy đủ khả năng và đã khảo sát kỹ càng tiếng Việt.
Thực tế thì trái lại rất ít người Việt chịu khó nghiên cứu nguồn gốc tiếng Việt, nhất là cách cấu tạo cơ bản, vì ngôn học là môn học rất khó hiểu, khô khan, không lôi cuốn được người đọc. Còn nếu có học giả khảo cứu thì thường đưa ra nhiều kết luận không rõ ràng, không phù hợp với các định nghĩa. Bài này có mục đích minh định lại các phần cơ bản nhất của ngôn ngữ, đó là âm vị mà số học giả Việt khảo cứu tiếng Việt còn ít hơn cả người Trung Hoa.

Sở dĩ có bài này là do cách nay một vài năm có đọc trên Internet nước ngoài đăng tải một phát biểu của tiến sĩ ngôn ngữ Hà Nội cho rằng tiếng Việt có 36 âm vị và từ đó đến nay không ai thắc mắc gì cả. Nhận định của nhà ngôn ngữ đã làm tác giả ngạc nhiên vì nếu căn cứ theo nhiều tài liệu Tây phương thì số âm vị này quá ít nếu đem so với tiếng Khmer và Thái. Tiếng Việt là tổng hợp của nhiều thứ tiếng, trong số đó có cả tiếng Mon-Khmer và Thái, nên không thể nào có số âm vị quá khiêm nhường như thế.
Cuốn Thai phrase book & dictionary chi thấy tiếng Thái có 74 âm vị gồm 21 phụ âm, 48 nguyên âm và 5 thanh. Cuốn sách hướng dẫn du lịch Cambuchia cho rằng tiếng Khmer có 57 âm vị gồm 33 phụ âm và 24 nguyên âm. (TK 1)

Ngay cả tiếng Anh tuy là ngôn ngữ đa âm tiết mà cũng có 43 âm vị gồm 13 nguyên âm và 30 phụ âm theo bảng Phoneme Codes, International Phonetic Alphabet (IPA). (TK 2)
Một tác giả khác cho tiếng Anh có 40 âm vị. Vì âm vị rất khó hiểu và khó phân tích nên ngay cả các nhà ngôn ngữ học Tây phương cũng không nhất trí về con số âm vị tiếng Anh, huống hồ là ta.
Vốn không biết một tí gí về ngôn ngữ học và cái ông Tiến sĩ này lại chỉ phát biểu suông, không đưa ra giải thích hay nêu ra bảng liệt kê các âm vị nên không rõ ông ông ta đếm theo kiểu nào để ta có thể phân tích và bàn luận
‘’Cô có biết đã lái hơn 100 cây số một giờ không?”, cảnh sát công lộ hỏi.
“Không thể được”, cô Ký Điệu chống chế.”Tôi chỉ mới rời nhà có hai mươi phút mà”
Như vậy là có ba loại người trong xã hội - người biết đếm và người không biết đếm.
Tuy không có một chút đầu mối nào nhưng muốn tìm hiểu thì không phải là không có cách. Cách dễ nhất là thăm dò những người có thẩm quyền về ngôn ngữ học coi họ có ý kiến như thế nào. 
Đi hỏi một Tiến sĩ ngôn ngữ học VN GS Bửu Khải là tiếng Việt có bao nhiêu âm vị thì được trả lời là có 36, y chang cái ông Hà Nội. Lại hỏi thêm ‘’oi’’trong oi ả có bao nhiêu âm vị thì trả lời là 2. Câu trả lời này cho thấy có một sự khác biệt với ý niệm thông thường của các nhà ngữ học Tây phương. Số âm vị quá ít là do sự đồng hoá âm vị với chữ cái, nghĩa là đập vỡ các âm vị phức tạp thành từng mảnh vụn theo kiểu bắn phá nguyên tử bằng trung hòa tử, một điều mà Tây không làm.
Phương cách khác, không phải bằng cách tra cứu sách vỡ vì sách vở về âm vị tiếng Việt rất hiếm hoi, mà tìm kiếm Vietnamese phoneme trên Internet bằng máy rà tìm Goegle. Có nhiều trạm mạng về Chinese phoneme nhưng chỉ có một bài của ngừơi Việt về âm vị VN. 

Vài bài của người Trung Hoa viết về âm vị tiếng Việt !!!
Bài của tác giả Taiffalo thì khá rõ ràng gồm có bốn bài, nghiên cứu và phân tích âm vị tiếng Việt thuộc, tác giả cũng cho rằng tiếng Việt phát âm miền Bắc gồm có 36 âm vị và phân chia như sau :
19 phụ âm
b , /c/ chết , /d/ (đi), /f/ phở, g , h , /k/ (C, K, Q như quít kia cà), l , m, n , nh , /ng/ (nghi ngờ),
p (pin), /s/ (cả x lẫn s như xứ sở), t, /th/ , /v/, /x / (khí), /z / (gi và r như ra gì)
11 nguyên âm
i /i/ lính biết, đi chịu
ê /e/ ếch hiểu hết
ư / / tư người
ơ /F/ chợ sớm
u /u/ chụp chum
ô /o/ tôi buồn quốc hôm
e /E/ meo
o / / ngon
a /a/ bài làm
ă /ce/ ăn
ay /A/ may phay
Tổng cộng có 36 âm vị = 6 thanh+19 phụ âm + 11 nguyên âm
Cuối cùng rồi cũng tìm ra được đâu là âm vị tiếng Việt. Như vậy là bất quá tam, cả ba học giả gạo cội đều nhất trí về cùng con số 36. Tuy thế nhưng xác suất đúng có thể không cao vì chưa được chọn lựa một cách ngẫu nhiên vì có thể cả ba học cùng một sách vở hay thuộc cùng một trường phái cổ điển, không coi các nhị trùng âm và tam trùng âm là âm vị.
Họ đồng nghĩa âm vị với chữ cái, cộng thêm các dấu ă,â,ô,ơ,ư,ê và 6 thanh thành 36 âm vị.
Phải chăng các nhà ngôn ngữ này có nhận định đúng hơn các nhà ngôn ngữ học Tây phương?
Bài duy nhất của người Việt trên Internet không đề xuất xứ cho rằng tiếng Việt miền Bắc có 44 âm vị gồm có 6 thanh, 22 phụ âm (không có r, tr,s, giống như nhận định của nhà ngôn ngữ học Nguyễn Đình Hoà nói ở dưới), 13 nguyên âm, 3 nhị trùng âm (có nhị trùng âm nhưng quá ít). Vì phần liệt kê bị để trắng nhách không nhìn thấy gì cả nên cũng không có cách gì để phê phán.
Muốn biết các nhận định của người Trung Hoa về ngôn ngữ Việt có chính xác hay không, ta hãy xem người Trung Hoa khảo cứu âm vị tiếng Trung Hoa như thế nào để thẩm định khả năng của họ.

Âm vị tiếng Hán
Một bài khảo cứu rất công phu của Chinese Accademy of Sciences ở Beijing lốt xuống (download) từ Internet cho rằng
-tiếng Trung Hoa có 140 âm vị với thanh sắc (Chinese has 140 phonemes considering tone)
-Tiếng Trung Hoa có 405 âm tiết không thanh sắc (Chinese has 405 syllables without tone (C+V or C+V+Nasal).
-Tiếng Trung Hoa có số âm tiết với thanh sắc khoảng 1300 (Chinese has a limited number of syllables about 1,300 considering tone)
Viện ngôn ngữ BK có nhận định sai lầm là sát nhập thanh sắc vào âm vị chớ không coi thanh sắc là âm vị (Xem phần thanh sắc ở dưới). Vì số âm vị được nhân với 5 thanh nên tổng số âm vị trở thành 140 âm vị, đứng vị trí number one trên thế giới, qua mặt cả tiếng Việt Thái Khmer! Điều này khó có thể là một hiện thực.
Các nhà ngôn ngữ học Trung Hoa định nghĩa âm vị khác, mỗi người một ý. Một học giả khác cho rằng tiếng Trung Hoa có 45 âm vị như sau :
5 thanh không sắc hỏi huyền nặng
25 phụ âm:
b p m f d t n l g k h j q x zh ch sh r x c s @ (th) y w yu
15 nguyên âm:
a o/e ai ei/ie ao ou an en ang eng ong I u u” er
Tác giả coi nhị trùng âm là âm vị. Có sự nhầm lẫn là các âm an, en, ang, eng, ong không phải là âm vị mà là âm tiết. Ang là một âm tiết gồm có hai âm vị a và ng. Như vậy tiếng Trung Hoa chỉ có 10 nguyên âm.
Thay vì có 25 + 15 + 5 = 45 âm vị tiếng Trung Hoa có tổng số âm vị là 25 phụ âm + 1 (ng) + 10 nguyên âm + 5 thanh = 41 âm vị, ở vị trí trung bình.
Con số 41 cũng còn nhiều hơn số âm vị tiếng Việt, một điều khó có thể xãy ra vì tiếng Việt có số âm tiết gắp 20 lần tiếng Hán nên không thể nào có số âm vị ít hơn được.
Muốn biết sự thật như thế nào thì không còn cách nào khác hơn là phải xem xét lại thật cặn kẽ các định nghĩa về nguyên âm và âm vị.

Các định nghĩa cơ bản
Các định nghĩa dưới đây về phoneme, syllable, word được phối hợp và điều chỉnh lại từ nhiều tự điển tiếng Anh. Ngay cả các định nghĩa trích từ các tự điển to tổ bố này cũng không thật chặt chẽ, đâu ra đấy mà thường là để lững lơ như con cá vàng, ai hiểu sao thì hiểu và do đó dễ gây ra ngộ nhận. Sẽ đưa ra định nghĩa
Nguyên âm. Sau đây là vài định nghĩa của nguyên âm từ nhiều tự điển:
*Một đơn vị nhỏ nhất của lời nói có thể làm thành một tiết.
*Một đơn vị nhỏ nhất của lời nói có thể tự thành hình bằng một luồng hơi thở liên tục và cũng có thể, tự mình, làm thành một tiết.
*Tiếng nói tạo bởi sự rung động của dây phát âm nhưng không có sự cọ sát nghe được.
Tóm lại ‘’Nguyên âm là đơn vị nhỏ nhất của lời nói, phát âm liên tục, có thể tự làm thành một tiết’’
Từ oai có bao nhiêu nguyên âm? Các nhà ngôn ngữ học Việt và Trung Hoa cho là có ba nguyên âm là o, a và i nhưng theo định nghĩa trên thì chỉ có một nguyên âm duy nhất vì từ oai phát âm liên tục chớ không bị đứt đọan.
Phụ âm còn được gọi là tử âm (consonant, có nghĩa là hoà hợp tiếng), một tiếng khi thành lập một tiết phải kết hợp với nguyên âm nghĩa là tự một mình nó không thể tạo ra một âm được như các âm t, m, k.
Bán âm là âm nằm giữa nguyên âm và phụ âm nghĩa là phát âm như nguyên âm nhưng phải đi kèm theo nguyên âm. Tiếng Anh có hai bán âm /j/ ( phát âm giống y, như young hay D nhẹ miền Nam) và /w/ (phát âm gần với giống u, như with). 
Tiếng Pháp có ba bán âm là /j/, w và /hui/ như trong huit (tám).
Tiếng Việt có bán âm w như quà (wà, miền Nam) và Y ký hiệu là /j/ đọc như D nhẹ.
Một cán bộ nói joke (dốc) với dân miền Nam 
“Nông trường ở miền Bắc rất rộng, ruộng của công tử Bạc Liêu đem so thì chẳng thắm vào đâu. Công nhân thường thức dậy vào lúc 5 giờ sáng, lái xe cả ngày, tới chiều tối may ra mới đi hết nông trường”
Một nông dân miền Nam suy nghĩ hồi lâu rồi trả lời:”Chúng tôi đôi khi cũng có một chiec xe như thế”
Nguyên âm kép (Nhị trùng âm, diphthong): còn gọi là nguyên âm lướt tức là gliding vowel, một âm thay đổi phẩm chất trong một tiết đơn độc. Âm bắt đầu từ một nguyên âm và chuyển sang một nguyên âm khác. Thí dụ như ấy, oi, hao, biu, hia, toát, ai, tâu, tương. hay tiếng Anh eye (ai).
Nguyên âm ba (tam trùng âm, triphthong) như khuya, tươi, tuyên hay hour (aʊə)
Tiếp tố (Affixation) : prefix tiền tố, suffix hậu tố. Tiếng Việt không có tiếp tố nên ta khỏi mất công khảo cứu.

Âm vị (phoneme): Đây là một trong những từ khó định nghĩa cho thật chặt chẽ và rõ ràng.
Nhiều tự điển Anh ngữ có một định nghĩa khác nhau như dưới đây
*Đơn vị nhỏ nhất của một ngôn ngữ có thể truyền đạt một ý nghĩa cá biệt, như m của mat và b của bat.
*Đơn vị của tiếng nói cá biệt từ đó âm tiết được thành hình.
*Âm vị là tiếng nhỏ nhất (smallest sound) trong ngôn ngữ.
*Đơn vị âm thanh không thể phân tích thành đơn vị nhỏ hơn (mà không làm thay đổi nghĩa của từ.
*Đơn vị nhỏ nhất của tiếng nói trong một ngôn ngữ có thể làm phân biệt hai từ như pan và ban.
*Âm vị là đơn vị nhỏ nhất một đơn vị cơ bản và lý thuyết của tiếng nói của âm có thể làm thay đổi nghĩa của một từ. Tùy theo ngôn ngữ và tùy theo chữ cái, âm vị có thể được viết bằng một chữ cái, có nhiều trường hợp ngoại lệ (nhất là trong tiếng Anh).
*Đơn vị nhỏ nhất của âm trong một ngôn ngữ, và là thành phần cấu tạo tiết, như đơn vị ba thành phần (phụ âm, nguyên âm, phụ âm) mà sự thay đổi sẽ làm thay đổi nghĩa của từ (word), như làm phân biệt hai từ ban và van, chỉ khác nhau bởi hai nguyên âm b và v, và được gọi là âm vị,và ban và bin, chỉ khác nhau ở nguyên âm /a/ và /i/, cũng được gọi là âm vị, tiếng Anh bait là một đơn âm có ba âm vị b, ai (ghi âm là ei) và t.
Vài định nghĩa để lơ lững ai hiểu sao cũng được nên nhiều học giả, ngay cả các tiến sĩ ngôn ngữ học, cũng bị nhầm lẫn để rồi đem phân tích các trùng âm thành nhiều nguyên cơ bản và kết luận tiếng Việt có 36 âm vị và tiếng Tàu có 140 âm vị.
Âm vị được định nghĩa tổng hợp lại như sau:
‘’Âm vị là một đơn vị nhỏ nhất và liên tục của tiếng nói, làm phân biệt các từ, từ đó tiết được thành lập’’

Trùng âm có phải là âm vị hay không?
Cái mấu chốt của vấn đề là ở chỗ các nhị và tam trùng âm là một âm vị hay tập hợp nhiều âm vị.
Trường phái cổ điển không công nhận trùng âm là âm vị.
Trường phái Tây phương coi mỗi trùng âm là một âm vị.
Quan niệm cổ điển không đúng vì các lý do sau đây :
-Nếu chúng ta đã khẳng định các phụ âm kép đầu từ /th/, /ng/, /nh/, /kh/ là âm vị thì sẽ không nhất quán nếu chúng ta không công nhận các trùng âm là âm vị. Phụ âm và nguyên âm đều có tác động như nhau trong sự thành lập âm vị.
-Mỗi âm vị phải được phát âm một cách liên tục, nói khác đi âm vị không thể đập vỡ ra cho nhỏ hơn nữa mà không làm thay đổi nghĩa của từ. Thí dụ âm Ía không thể phân tích thành hai âm Í và a vì như thế sẽ có nghĩa khác như câu
“Cô Thúy uể oải tới Chú Ía hát hò” nếu tách rời các trùng âm thì sẽ có nghĩa hoàn toàn khác hẳn là
“Cô Thú-y ủ-ê o ai ? Tới Chú, í-a hát hò”
-Bây giờ ta hãy dùng lý luận để xem các trùng âm có vị trí như thế nào trong văn phạm. Lấy thí dụ âm ‘oai’ trong từ ngoái là từ, âm tiết hay âm vị?
Rõ ràng oai không phải là từ vì ngoái mới là từ.oai cũng không phải là âm tiết vì ngoái mới là âm tiết.
Còn nếu ta phân tách thành ngó-ai thì từ sẽ có hai âm tiết ngó và ai. Điều này mâu thuẩn với sự thật không chối cải được là ngoái chỉ có một âm tiết. Đó là chưa kể phân tích như thế sẽ làm thay đổi nghĩa của từ, điều này không được làm. 
Không phải là từ, không phải là âm tiết, cũng không thể phân tích ra nhỏ hơn nên oai phải là âm vị, không còn con đường nào khác để chọn lựa.
-Tách rời các trùng âm là trái với quan điểm của các nhà ngôn ngữ học Tây phương khi nghiên cứu ngôn ngữ Á Châu. Các nguyên âm ghép sau đây đều được coi là vowel hay phoneme : ai, ao, ưa, ia, iu, uay, nguyên âm dài như uu trong tiếng Thái hay ai,ao,ay,oa trong tiếng Khmer hoặc ai,au trong tiếng Indonesia.
Tách rời các trùng âm sẽ làm thay đổi ý nghĩa của một câu nói, tương tự như cách chấm câu.
Một Giáo thụ (Professor) ngôn ngữ học viết một số từ lên bảng
‘’Đàn bà không có đàn ông là con số không’’ rồi ra lệnh cho sinh viên chấm câu cho đúng.
Con trai viết :’’Đàn bà, không có đàn ông, là con số không’’
Con gái viết :’’Đàn bà không có, đàn ông là con số không’’
Đa hệ viết : ‘’Đàn bà không, có đàn ông, là con số không’’
-Cứ cho là các học giả Tây không rành ngôn ngữ Á Châu nên xếp sai các trùng âm vào âm vị đi nữa, nhưng tại sao bốn nhị trùng âm tiếng Anh, tương đương với bốn âm tiếng Việt, đều được đặt trong bảng âm vị ?
Thật vậy theo bảng Amercan English Phoneme Representation thì tiếng Anh có 40 âm vị phân chia ra như sau :
24 phụ âm
15 nguyên âm gồm có 11 nguyên âm đơn (monothongs), 4 nguyên kép (di  /aw/ trong bout, /ay/ trong bite, /yu/ trong butte hay tiu nguỷu, /oy/ trong boy) và 1 untressed âm /er/ như trong banana.
Nếu nhị trùng âm là âm vị thì đương nhiên các tam trùng âm trong tiếng Việt phải được coi là âm vị.
-Nhiều âm tuy ghi giống hệt nhau nhưng đọc khác nên số âm vị phải khác nhau. Thí dụ seatle, vì đọc là si- ê - thầu nên ea có hai âm vị e và a nhưng seat vì đọc là si:t nên ea chỉ có một âm vị.
Tùy theo ngôn ngữ và chữ cái, âm vị có thể được viết bằng một chữ cái nhưng cũng thường được viết bởi nhiều chữ cái như âm vị eau trong beauty tiếng Anh hay iêu trong biêu tiếng   Việt.
Không phải khi viết ba nguyên âm kề nhau như are là có ba âm vị. Âm are chỉ có một âm vị với ký hiệu aI. Bought chỉ có bốn âm vị là b, ao, t và dấu nhấn, gh không tính vào âm vị, theo một bộ tự điển tiếng Anh.

Thanh sắc: Thanh sắc được đo lường bằng tần số (Hz). Cái gì làm cho má khác với má, ma, mã, mả, mạ ? Đó là thanh sắc. Vì âm vị là một đơn vị âm thanh làm phân biệt các từ với nhau nên thanh sắc là âm vị chớ không phải là một thành phần của âm vị như viện ngôn ngữ học Bắc Kinh đã phân loại như trên.
Số thanh thay đổi từ 4 đến 8 như tiếng BK có 5 thanh, tiếng QĐ tự xưng là có 8 thanh, điều này cũng nên xét lại vì nhiều thanh chính người QĐ cũng không phân biệt được. Tương tự chỉ có 50% dân miền Bắc là phát âm đúng hỏi ngã theo một kết quả của một học giả khi phân tích âm thanh của một số người, 50% còn lại phát âm dấu hỏi gần như là dấu nặng, dấu nặng thành lơ lững, dấu ngã gần dấu sắc.
Muốn cho từ ngữ không lẫn lộn thì 5 thanh như tiếng Thái là mức tối đa (làm sao qua mặt được thanh sắc tiếng Thái, được coi như phát xuất ra thanh sắc tiếng Việt và Tàu?), nhiều hơn thì chữ tác đánh chữ tộ, chính ngay dân địa phương còn không phân biệt được thì nói gì đến những người thuộc miền khác, họ nghe không quen thì tưởng là bỏ dấu sai. Khi có nhiều sắc tộc cùng xữ dụng một ngôn ngữ thì ngôn ngữ sẽ từ từ trở nên giản dị, dễ hiểu, dễ phát âm như tiếng BK đã tự động đào thải nhiều âm phức tạp hay tiếng Sanscrit đã giản dị hóa để trở thành tiếng Ấn hiện tại.
Tiếng Mã Lai, Tây Tạng, Mon có âm điệu nằm giữa dấu nhấn và thanh nghĩa là khá quan trọng, không phải là không có cũng không sao như tiếng Anh.
Mẫu tự Latin: Tập hợp 26 âm vị cơ bản nhất gồm có 5 phụ âm a, e, i, o, u và 21 phụ âm, đủ để ghi tòan bộ âm vị tiếng Latin nhưng không đủ để ghi hết tất cả các âm vị của mọi ngôn ngữ.

Số âm vị không căn cứ vào số nguyên âm hay phụ âm. Tổng số âm vị của một ngôn ngữ có thể nhiều hơn hay ít hơn tổng số 26 chữ cái Latin. Một âm vị có thể dùng một hay nhiều chữ cái để tượng trưng.
Từ 26 chữ cái ta có thể ghi hằng trăm âm vị. Từ số âm vị ta có thể ghi hằng chục ngàn âm tiết. Tiếng Hán có 41 âm vị và 1347 âm tiết. Vì chữ Hán ghi âm tiết nên tối thiểu cũng phải có hằng ấy chữ tượng hình. Nhưng số từ cần thiết dùng trong văn hóa kỹ thuật cần ít nhất hằng chục ngàn từ nên không thể tránh được mỗi từ có rất nhiều từ đồng âm. Để tránh từ nọ đọ với từ kia họ phải sáng chế nhiều chữ Hán khác nhau cho mỗi từ đồng âm, vì thế có chừng mười ngàn chữ Hán cho hơn một ngàn âm tiết. Muốn đọc được sách báo phải cần
hơn hai ngàn chữ và mất khoảng bảy năm.

Chữ Quốc ngữ dùng mẫu tự Latin để ghi âm vị và tổng số âm vị tiếng Việt là 81 nên học rất dễ trung bình chừng hai tháng. Làm một con tính ta thấy ngay nếu phải học 2000 chữ Hán thì thời gian là (2000: 81) x 2 = 49 tháng hay 4 năm. Còn nếu phải học 10000 chữ thì thời gian dài gắp năm lần tức 20 năm.
Bỏ ra 20 năm chỉ để học chữ Hán thì hơi phí của. Thời gian dài đăng đẳng này có thể dùng để lấy được mấy cái bằng Tiến sĩ. Thời cổ văn minh Trung Hoa rất xán lạn nhưng dần dần đứng khựng lại trong khi Tây phương phát triển mạnh mẽ, có thể một phần là lối chữ tượng hình, tuy có điểm lợi là thống nhất được nước Trung Hoa nhưng đồng thời một phần nào đó đã ngăn cản sự tiến bộ về khoa học kỹ thuật.
Để ghi tiếng nói người Nhật dùng chữ chữ Hán và chữ Nhật. Cả hai ghi âm tiết nhưng vì tiếng Nhật chỉ có 140 âm tiết nên chữ Nhật chỉ cần bằng ấy chữ viết.

Tiếng Việt phức tạp hơn nhiều vì có số âm tiết khổng lồ khỏang 18000, tạm gọi là đủ để diễntả mọi sự việc thông thường mà không bị làm khó hiểu bởi từ đồng âm và do đó có thể dùng chữ cái Latin để viết rời từng từ một cách dễ dàng, rõ ràng và gọn ghẽ. Trái lại nếu ta dùng chữ Hán để ghi tiếng Việt thì sẽ gặp muôn vàn khó khăn, như chữ Nôm chẳng Hạn khó học khó nhớ hơn cả chữ Hán vì phải nhớ tới 18000 chữ khác nhau.
Ngôn ngữ có thể có từ 2 tới 25 nguyên âm, và 5 tới 100 phụ âm (độ chừng, có ai biết chính xác là bao nhiêu không?). Tổng số âm vị trong mỗi ngôn ngữ thay đổi từ ít nhất là 11 trong tiếng Rotokas (Papa New Guinea), 12 trong tiếng Hawaiian tới nhiều nhất lên đến 141 của bộ lạc !Xu ở Phi châu. Xin kể thêm vài trường thái quá như có:
2 nguyên âm trong vài phương ngữ của tiếng Abkhaz
3 nguyên âm trong nhiều tiếng dân da đỏ Mỹ châu, Á Rập hay Úc đen
25 nguyên trong tiếng Punjabi
6 phụ âm trong tiếng Rotokas
Hơn 100 phụ âm trong tiếng Xu
Ta thấy có sự tương tự giữa Vật lý và ngôn ngữ. Phân tử, nguyên tử và hạch nhân tương ứng với từ, âm tiết và âm vị. Từ gồm một hay nhiều âm tiết giống như phân tử cấu tạo bởi một hay nhiều nguyên tử. Nguyên tử có thành phần là hạt nhân tương ứng âm tiết có thành phần là âm vị.

Tưởng cũng nên lập lại vài định nghĩa để dễ bề so sánh :
Phân tử (molecule) : mãnh nhỏ nhất (thường là một nhóm nguyên tử) của vật chất được làm cho nhỏ hơn bằng cách phân chia mà không làm thay đổi đặc tính hoá học.
Nguyên tố (element) : Chất không thể phân giải được thành chất đơn giản hơn bằng phương tiện hoá học.
Nguyên tử (atome) : phần tử nhỏ nhất của nguyên tố hoá học hay là phần nhỏ nhất của vật chất không thể chia nhỏ hơn nữa bằng phương tiện hoá học.
Hạch nhân (nucleus) : Hạt nằm ở trung tâm nguyên tử gồm có proton và neutron. 
Âm vị là cái mầm, cái lỏi, cái cốt lỏi, cái cùi, cái ngòi, cái hạt nhân hay hạch nhân của tiếng Việt. Và cũng giống như sinh vật, mọi sinh vật ngoài một số gen riêng biệt còn có một số gen chung với các giống khác. Ngôn ngữ cũng thế, kể cả tiếng Việt, ngoài một số từ riêng tư cho từng ngôn ngữ còn có một số từ chung cho toàn thể tiếng nói của nhân loại. Tiếng Việt chứa nhiều tiếng Anh từ thời tiền sử cũng là chuyện thường tình, không có mới là quái lạ.
Nếu DNA có thể được dùng để tìm nguồn gốc người Việt thì ngôn ngữ cũng rất hữu dụng trong công cuộc truy cứu gốc tích người Việt nói riêng và Bách Việt nói chung. 
Allophone (âm vị giống) là biến thể của âm vị. Allophone của miền này có thể là phoneme của miền khác. Ch và Tr là allophone của miền Bắc nhưng là phoneme của miền Trung và Nam. Tương tự n và ng cuối âm tiết là âm vị miền Bắc nhưng là allophone của miền Nam.
Câu ‘’Chị Lan than thở trên thang’’ nếu ở miền Bắc thì trở thành ‘’Chzị Lan zầu zĩ than thở chzên thang’’ còn miền Nam sẽ là ‘’Chị Lang rầu rỉ (dấu hỏi) thang thở trên thang’’
Morpheme (hình vị) là đơn vị nhỏ nhất có ý nghĩa (a word or meaningful part of a word for instance 'the', 'speak' or the 'en' of 'spoken') như là một cơ bản (base), tiền tố hoặc hậu tố.
Một từ có thể chứa hơn một hình vị. ‘Unable’ có thể chia thành hai hình vị- tiền tố ‘un’ và  ‘able’, trong khi đó ‘mahogamy’ không thể chia nhỏ được nữa.
Tiếng Việt không có tiếp tố nên không có hình vị và mỗi từ đa số chỉ có một âm, ngoại trừ một số ít từ đa âm tiết như sa-vông, lông bông, cà nhổng, ba ba.
Vì ngôn ngữ học rất rắc rối và khó hiểu nên ít người chú ý tới và do đó số học giả ngôn ngữ học rất hiếm, đếm được trên đầu các ngón tay của một bàn tay. Nếu người nào để ý nghiên cứu thì lại hiểu vấn đề một cách lộn xộn, kể cả những nhà ngôn ngữ học. May ra thì mấy nhà toán học mới hiểu thấu mọi gút mắc của vấn đề nhưng mấy ông này còn lâu mới rớ tới vì đâu phải là nghề của chàng. Mà có muốn cũng không được.
Sau khi đã trang bị đầy đủ các định nghĩa thì bây giờ là lúc ta thẩm định lại số âm vị tiếngViệt. 

Âm vị tiếng Việt
Nếu ta theo đúng định nghĩa Tây phương về âm vị và phân tích theo các nhà ngôn ngữ Tây phương về nguyên âm thì tiếng Việt có rất nhiều âm vị. Xin liệt kê âm vị tiếng Việt phát âm miền Bắc như sau:
6 thanh điệu: không, sắc, huyền, hỏi, nặng, ngã
20 phụ âm :(ký hiệu phát âm được ghi trong hai gạch / /, nhưng để giản dị, không ghi ký hiệu nếu phát âm trùng với chữ cái).
B, /K/ (C vàK), /Chz/ (CH và Tr miền Bắc), /d/ (Đ), /G/ (G và Gh), H, Kh, L, M, N, Ng (Ngh),
Nh, P (Phụ âm đầu từ P là âm cổ nay dần dần phục hồi trở lại như pông sô, pia nô, pin),
/Kw/ (Qu như quít), /F/ (Ph), T, Th, V, X, /Z/ (D, R, Gi miền Bắc).
Miền Nam có thêm 7 phụ âm Ch, Tr, R, S, J (như Jarai, jăm bông, ăn jơ), Y (Y, ghi âm quốc tế là /j/, là phụ âm đầu từ D nhẹ miền Nam và dùng cho các từ ngoại quốc như đồng Yen, ya ua, yo yo, yoga), W (Qu, oa, Hoa), nhưng không có âm Chz, Z, Kw, V.
Tổng số phụ âm của phát âm miền Nam là 20 - 4 + 7 = 23.
Tổng số phụ âm cho mọi phương ngữ là 20 + 7 = 27
Nguyên âm
▪11 nguyên âm đơn (monothong): a, ă, â, e, ê, i (y), o, ô, ơ, u, ư
▪28 nguyên âm kép (diphthong, nhị trùng âm) : ai, ay, ây, ao, au, âu, eo, êu, ia, iu, iê, oa, oă,
oe, oi , ôi, ơi, ua, uâ, uê, ui, uô, uy, ưa, ưi, ươ, ưu, ia.
▪9 nguyên âm ba (triphthong, tam trùng âm): iêu, oai, oay, uây, uôi, ươi, ươu, uya, uyê

Tuy tên gọi là tam trùng âm nhưng nhiều khi chỉ là nhị trùng âm dài. Thí dụ như uôi là uui, ươi là ư ư i,ươu là ưưu.
Tổng số nguyên âm là 11 + 28 + 9 = 48
Miền Bắc có 6 thanh +20 phụ âm + 48 nguyên âm = 74 âm vị, bằng với số âm vị tiếng Thái.
Miền Nam có 5 thanh +23 phụ âm + 48 nguyên âm = 77 âm vị,
Tiếng Việt chung cho mọi phương ngữ có = 74 + 7 = 81 âm vị.
Đến đây ta mới thấy sự khó khăn và tài tình của các nhà tiền phong khi sáng tạo chữ Quốc ngữ. Họ phải suy nghĩ nhiều cách để cả ba miền cùng xữ dụng một thứ chữ nhưng có thể đọc theo phát âm của mình, tương tự như Hán tự dùng cho mọi sắc dân Trung Quốc.
Các ca sĩ trẻ nước ngoài phát âm Ch thành Chs tương tự như âm Ch tiếng Anh, nghe rất kỳ lạ và ngộ nghĩnh y như Mỹ nói tiếng Việt, lơ lớ giọng mũi.
Liệt kê các âm vị rất khó khăn nên mỗi người một ý kiến. Như Giáo sư ngôn ngữ học Nguyễn Đình Hòa trong ‘Tiếng Việt không son phấn’ cho tiếng Việt gồm mọi phương ngữ có 22 tử âm, thể theo một bài lấy từ Internet ‘’Đáng lưu ý là bảng liệt kê 22 âm vị tử âm (consonant phonemes) dùng trong mọi phương ngữ Việt Nam -- bằng ký hiệu như /b-/, /f-/,/z-/, vân vân -- có thể đứng đầu các âm tiết, cùng với những chữ cái trong mẫu tự Việt được dùng để biểu hiện những âm vị này. Thí dụ, âm vị /k-/ thường được biểu hiện bằng những
chữ cái c-, k-, q- (con cá, cái kim, quả cam) (trang 20). Biểu đồ của 6 thanh điệu (trang 20) cho người đọc thấy rõ độ cao thấp cùng với đường uốn lượn của từng thanh điệu’’
22 phụ âm là gồm cả R, Tr, S.
Không ghi ra nguyên âm nên không biết GS cho biết có bao nhiêu nguyên âm.Ch và Tr ở miền Bắc hơi nặng phát âm thành chz, không có âm J nhưng có âm nặng hơn Gi. Vì thế các âm J đều bị thay thế bởi âm Gi như Jarai, Java, jăm bông, nạc jăm biến thành Gia Lai, Gia va, giăm bông, nạc giăm.
Gi không phải là một âm gồm hai âm vị G và I mà là một vị duy nhất /z/. Âm Gi có nguồn gốc xa xưa từ âm /ji/ tiếng Hán, ngày nay chỉ một số nhỏ đọc đúng Gi, còn đa số đọc là /z/ nên ta có thể cho nhập chung vào âm vị /z/.
Tương tự Qu không phải tạo thành bởi hai âm vị mà là một âm vị duy nhất /kw/ , khác biệt với âm vị /k/ (phụ âm c). Quả cam không phải là /k/ủa cam -vì như thế sẽ đọc là của cam mà là /kw/ả cam. Tương tự quốc là /kw/ốc chớ không phải là /k/uốc vì như thế sẽ đọc là cuốc (xuổng). Sở dĩ các nhà tiền phong không dùng Kw mà dùng Qu để ba miền đều đọc được theo đúng phát âm của mình. Qu đọc là /kw/ như trong từ quit tiếng Anh. 
Tiếp theo là nói về nguyên âm.
Để tiện so sánh xin ghi lại (pâ là phụ âm, nâ là nguyên âm) các nhận định của Tiến sĩ: 6 thanh +19 pâ+11 nâ đơn= 36
Bài Internet: 6 thanh +22 pâ+ 13 nâ đơn+ 3 nâ kép = 44
Tiếng Thái: 5 thanh +21 pâ +48 nâ =74 âm vị
Tiếng Khmer: 33 pâ + 24 nâ =57 âm vị
Tiếng Anh: 24 pâ+11 nâ đơn+4 nâ kép+1 untressed âm= 40 âm vị
Tiếng Việt: 6 thanh+23 pâ+11nâ đơn+28 nâ kép+9 nâ ba= 81 âm vị
Số âm vị phù hợp với dự đoán là tiếng Việt phải có số âm vị bằng hay nhiều hơn số âm vị tiếng Khmer (57) hay tiếng Thái (74) và nhiều hơn hai lần tổng số 36 âm vị do các nhà ngôn ngữ học Việt và Trung Hoa gán cho tiếng Việt. Tiếng Việt có ít phụ âm nhưng có rất nhiều nguyên âm. 
Miền Nam tuy có âm vị nhiều hơn miền Bắc nhưng có ít âm tiết hơn vì không phân biệt được các phụ âm cuối từ như lan với lang, tiếc với tiết, hoa với qua và oa.
Nếu kể thêm nhiều phụ âm kép đầu từ Bl, Dr, Pl, Fl, Fr, Ge đã được áp dụng vào khoa học kỹ thuật hoặc trong các từ Việt hoá như blốc nhà, dra trải giường, Pleiku, platin, miếng plắc mạ vàng, fluor, Freon, bẹt gê, gen nhiểm sắc thể, mà thời tiền sử đã từng hiện diện trong tiếng Việt thì tổng số âm vị tiếng Việt còn cao hơn nữa, gần con số 90. 

Nhưng thôi, như thế là quá đủ để chứng minh số âm vị tiếng Việt trội hẳn số âm vị mà các nhà ngôn ngữ học Ta và Tàu đã gán cho tiếng Việt.
Nếu đếm theo kiểu Trung Hoa tức là nhập thanh sắc vào âm vị thì tổng số âm vị tiếng Việt là (81- 6)x 6 = 450. Số này quá cao, và không ai đếm lọa kỳ như thế. Xem ra thì ngôn ngữ học rất khó hiểu nên ngay cả viện ngôn ngữ học cũng sai lầm như thường.
Một số câu hỏi mà thầy giáo không muốn gặp :
-Tại sao âm học không đánh vần theo cách phát âm như Y được ghi âm là /j/ ?
-Tại sao monosyllabic chỉ từ đơn âm sao lại có 5 âm tiết ?
-Tại sao Đề li 24 giờ, 365 ngày một năm mà lại có ổ khoá ?
-Tại sao vô giá trái ngược với vô giá trị hay không giá?
- Nếu xe chạy nhanh bằng tốc độ ánh sáng, cái gì xãy ra nếu ta vặn đèn sáng lên ?

Âm R trong tiếng Việt cổ 
Có người cho miền Bắc thời cổ không có âm R. Nếu không xem xét kỹ ta thấy nhận xét này không phải là không có lý vì các ngừơi bạn láng giềng như Lào, Miến Điện và mọi loại người Tàu đều không có R.
Thực sự thời tiền sử người Văn Lang đã phát âm R, có thể giống âm R của phát âm miền Trung hay âm R của Khmer, hơi khác với miền Nam. Ở miền Trung âm khi phát ra âm R thì lưỡi chạm vào bên trên phía trong, phát âm lăn tròn (rolling) gần âm R tiếng Anh còn miền Nam thì lưỡi ở phía ngoài gần âm R tiếng Pháp. Âm R Khmer thì lưỡi run động nhiều hơn.
Âm R Miền Bắc bị biến mất là do ảnh hưởng phát âm Bắc Kinh. Thật vậy có nhiều từ cổ miền Bắc vay mượn tiếng Mã Lai có âm R như co ro tiếng Mã Lai dùng để chỉ con rùa, rông chơi là do ronda tiếng ML, rổng là do rongga tiếng ML và râng tiếng Khmer.
Cứ cho là người Việt thời tiền sử không có âm R và sau đó đã vay mượn tiếng ML từ thời Văn Lang đi, nhưng ta không thể giải thích được tại sao lại có những từ trùng hợp với tiếng Khmer mà ta chỉ mới tiếp xúc với họ từ thế kỷ 17, như ruồi là do ruôi và rượt là do rươt tiếng Khmer? Còn nữa, tại sao có nhiều từ trùng với tiếng Mon như rồi là rà, mưa rào là pròa mà ta không bao giờ tiếp xúc với họ. Chỉ có thể giải thích là tiếng Việt có âm R từ thời tiền sử và tiếng Việt có liên hệ với tiếng Mon Khmer và Mã Lai. Âm R bị biến mất dưới thời Bắc thuộc
vì vùng Hà Nội bị ảnh hưởng nặng nề của phát âm Bắc Kinh. Và không phải mọi người Bắc đều không nói được R. Có nhiều vùng miền Bắc xa trung ương dân chúng nói ra R khá rõ, có khi còn rõ ràng hơn cả miền Trung và Nam.
Điều đáng chú ý là âm R hầu như hiện diện trong mọi ngôn ngữ chỉ trừ ngữ tộc SinoTiberto, Lào và miền Bắc. Tiếng Thái trên nguyên tắc có âm R nhưng người Thái thường nói thành L. Lý do là một số người Thái từ Vân Nam tràn tới Thái Lan chiếm đất của người  Mon Khmer vào thế kỷ thứ 13 không có R như người Lào. Phát xuất từ bên Tàu thì đương nhiên không có R. Còn người Thái cũ hay có học Phạn ngữ, cùng với người Mon và người Khmer gần ranh giới Campuchia thì có R. Các tiếng nói thuộc ngữ tộc Sino-Tiberto như tiếng Tàu (mọi loại), tiếng Tây Tạng và Miến Điện đều không có R nhưng lại có âm Z, tương tự như phát âm miền Bắc.

Ngữ hệ tiếng Việt
Như vậy có phải là tiếng Việt thuộc ngữ tộc Sino-Tiberto như vài học giả đã và đang đưa ra giả thuyết này?
Nếu cho là không thì tại sao một số âm miền Bắc lại gần với phát âm Hán Tạng? Câu trả lời là sỡ dĩ phát âm giống tiếng BK là do bị ảnh hưởng tiếng BK cả về từ ngữ lẫn phát âm.
Các âm R, Tr và cả các âm W, phụ âm đầu từ Y, Dr, Pl, Pr, Fl, Fr và nhiều phụ âm phức tạp đầu từ khác đã hiện hữu trong phát âm người Văn Lang, nhưng dưới thời đô hộ các âm trên đã bị âm Hán lấn áp. Cửu Chân và Nhật Nam ít bị ảnh hưởng nên vẫn còn giữ được âm R, Tr như ta đã thấy.
Có rất nhiều giả thuyết về ngữ hệ tiếng hệ, không có giả thuyết nào đúng mà cũng không có giả thuyết nào hòan tòan sai hẳn.
Tiếng Việt không thuộc ngữ hệ Hán Tạng nghĩa là không có nguồn gốc Trung Hoa vì nhiều lý so như sau :
-Tiếng Việt có số âm vị gần với tiếng Thái và Khmer hơn là tiếng Hán.
-Mặc dầu tiếng Việt có chứa hơn phân nửa tiếng Hán Việt nhưng các tiếng Nôm lại trùng với ngữ tộc Mon-Khmer và Thái hơn.
-Phát âm miền Bắc tuy gần giống phát âm BK, nhất là âm Z, nhưng không vì thế mà ta có thể kết luận tiếng Việt thuộc ngữ tộc Hán Tạng vì có nhiều âm vị mà tiếng Hán không có.
Một điểm đặc biệt của ngữ hệ Hán Tạng là chứa rất nhiều từ có âm vị Z như tiếng BK có âm Z, Zh, Tz, tiếng Tây Tạng có và âm giống Z như tso là hồ, zing-kyong, tiếng Miến Điện có Z, không R và Tr. Mã Lai có một số âm Z. Các tiếng thuộc ngữ tộc Mon-Khmer và Thái, Lào đều không có Z. Phát âm miền Bắc có rất nhiều âm Z và không R. Phải chăng tiếng Việt thuộc ngữ hệ Hán Tạng?
Không phải, tiếng Việt nhất định không phải thuộc ngữ hệ Hán Tạng. Sau 1000 năm bị ảnh hưởng nặng nề của văn hóa Trung Hoa, tiếng Việt khó có thể phát triển nhanh chóng từ 41 âm vị sang 81 âm vị và từ 1347 âm tiết thành 18000 âm tiết, trừ phi là tiếng Việt lại chịu ảnh hưởng nề của tiếng một nước khác. Lịch sử trong thời kỳ độc lập không thấy nói người Việt bị người Mon Khmer, Thái hay bất kỳ một nước nào khác đô hộ. Tiếng Việt chịu ảnh hưởng tiếng Thái không phải trong thời độc lập, và càng không phải trong thời Bắc thuộc, mà phải trước hay chậm nhất trong thời Văn Lang Âu Lạc.

Phát âm Hà Nội
Phát âm Hà Nội ngày nay nghiên về phát âm Thanh Nghệ Tĩnh do dân chúng các nơi khác tràn vào thành phố nâng mực độ từ 100000 lên hơn một triệu, phát âm Hà Nội ngày xưa trở thành thiểu số, chỉ còn chừng 50000, có cơ bị tuyệt giống. Như vậy phát âm Hà Nội xưa không phổ quát, chỉ tập trung ở khu vực Hà Nội và vùng lân cận, có thể không phải là phát âm nguyên thuỷ của người Việt. Nếu là thế thì nó có nguồn gốc từ đâu? Có thể từ phát âm BK chăng ?
Tiếng Việt bị ảnh hưởng nặng nề tiếng Hán về mặt từ ngữ thì quá đã quá rõ ràng. Nếu ta cho rằng tiếng Việt chỉ bị ảnh hưởng về mặt từ ngữ mà không bị ảnh hưởng bởi phát âm BK thì là một chuyện hi hữu, trái với đà phát triển tự nhiên. Một số âm Hà Nội rất gần với phát âm Bắc Kinh như các âm rịu (rượu) là do jỉu, không có âm R, Tr nhưng có nhiều Z (tiếng BK có âm ghi là R nhưng lại có phát âm tương tự S với lưỡi đụng vào vòm khẩu cái). Chỉ có dân chúng chung quanh Hà Nội bị ảnh hưởng sâu đậm phát âm BK vì ngày xưa chỉ có Hà Nội và Nam Định là có trường dạy và thi tiếng Hán, do các giáo sư nguyên gốc giảng dạy nên dân chúng ở đây giỏi tiếng Hán về cả từ ngữ và phát âm. Các vùng khác chỉ học lóm hay do mấy Ông đồ lô can giảng dạy nên phát âm sai giọng hay ít bị ảnh hưởng tiếng Hán.
Chính vì thế có thể dân ở khu vực xa trung ương còn giữ được phần nào phát âm nguyên thủy của người Việt.
Miền Nam thì dốt đặc cán mai, một chữ Hán cũng không có.
Cứ so sánh tên họ hai miền thì thấy rõ ngay. Tên họ miền Bắc và Trung nghe rất văn chương tao nhã, đôi khi quá Hán làm cho không ai hiểu nghĩa là gì. Thí dụ như Cung Tằng Tôn Nữ Trịnh Nhữ Như Thi made in Hòang gia, Đoàn Châu Các Các made in phim Hongkong, Tăng Thiên Diệp made in China, Đặng Trần Quế made by Ông đồ ta. 
Hầu như không tìm được ai có tên họ hoàn toàn tiếng Nôm ở Hà Nội, trừ bần cố nông như Thị Mẹt.
Trái lại Miền Nam rất ư là nôm na, tuy dễ hiểu nhưng nhiều khi bình dân quá độ như Trần Trụi Bông Giấy, Nguyễn thị Út Nữa (rán nín đẻ nhưng cuối cùng lại lọt thêm một trự), Trịnh thị Rót (miễn bàn), Địch thanh Tủng, Bùi thị Rớt (bị đẻ rớt), Đặng Thành Được (đánh cá ngựa là trúng cá cặp ngay), Huỳnh văn Đực Rựa (làm gì có Huỳnh thị Đực Rựa?), Thái Thành Mắm (con cháu bà giáo Thảo hay gốc gác Châu Đốc), Thạch Sanh Mười Lăm (đẻ dữ tợn).

Phát âm Sàigòn
Phát âm Sàigòn và phát âm miền Nam rồi đây cũng sẽ thay đổi vì chịu ảnh hưởng của phát âm Hà Nội và Hà Nội cũng sẽ phải thay đổi phần nào đó theo phát âm Sàigòn vì nhiều lý do.
Một trong các lý do là dân Hà Nội, dân miền Trung vào miền Nam khá đông. Mặt khác thông tin, giao lưu văn hoá hai miền sẽ có ảnh hưởng qua lại.
Phát âm miền Nam đã được tôi luyện, xào nấu, thêm thắt lại từ phát âm miền Trung và miền Bắc, do di dân nghèo hay của tội phạm nhẹ bị phát vãng trong công cuộc Nam tiến, lại thêm mắm thêm muối từ các tiếng Quảng Đông, Phúc Kiến, Triều Châu, Khmer, Chàm, Chà Châu Giang (Giang là sông, Chà là do chữ Java, Châu Đốc là do Châu Toch, tên con sông ở gần  Châu Đốc, phía bên Kampuchia. Tên núi Sam ở Châu Đốc là từ nói trại đi của từ Chàm, Kompong Chàm ở Campuchia là Vũng Chàm. Java đã biến thành sông Bà Hoà ở Cửu Chân. 
Một số người Chà Châu Giang hay một số dân miền Trung có thể lai giống Á Rậpnên khá cao, nhất là các em sinh tại nước ngòai rất cao mặc dầu cha mẹ ở mức trung bình).
Như vậy phát âm miền Nam đã được chọn lọc tự nhiên để từ từ trở thành đại chúng, do đóphải giản dị, dễ hiểu, dễ phát âm để mọi sắc tộc đều nói được. Chính vì thế mà âm V, Z đã biến mất nhường chỗ cho âm D nhẹ, W, J, R, Tr. Tuy nhẹ nhàng uyển chuyển và dễ uốn lưỡi theo tiếng nước khác nhưng cũng rất khó thay đổi thêm vì nó đã thay đổi rồi, không còn đường nào để binh
‘’Hai mươi năm mới gặp lại mà sao anh trông vẫn còn trẻ?’’
‘’Vâng. Trẻ mãi không già vì tôi đã già ngay từ khi còn rất trẻ’’
Phát âm Hà Nội rồi ra cũng phải thay đổi cho hiện đại, hợp thời trang, với khuynh hướng tòan cầu hóa ngôn ngữ và kinh tế, với Anh ngữ, với trào lưu thông tin, Internet, và dân nước ngoài, nhất là dân Hà Nội xưa trong lẫn ngòai nước
“Khi cán ngố vào Sàigòn thì mức độ thông minh IQ cả hai miền trở nên ngang ngửa”
Phát âm người Việt nước ngoài khác người trong nước vì nhiều phương diện như khôngdùng từ made in China, lai giọng Tây, nói chậm hơn do ít xữ dụng, ít người để đối thoại,nhiều khi cả ngày chỉ nói chuyện bà xã hay với đầu gối, không bị thúc đẩy bởi cuộc sống lúc
nào cũng ‘khẩn trương’.

Tiếng Việt cho mỗi miền là 75, chung cho cả nước khoảng 81 âm vị. Con số có thể thay đổi đôi chút nhưng không thể nào là 36 hay 44 được. Quí vị độc giả nghĩ sao?’
Gs Đoàn Văn Phi Long

Từ đây trở lên trên là bài đã đăng ở mạng Hương Quê (Thứ Hai 3/2/2003), soạn khi đi holiday ở Sydney, bài viết không dựa vào sách vở mà chỉ dùng ba cuốn tự điển tiếng Anh, hai Phase book bỏ túi, tốn khoảng gần hai ngày.
Sau chừng một vài năm, trong luận án cử nhân “Hệ thống cung cấp thông tin qua mạng điện thoại và ứng dụng” dày hơn 40 trang của hai sinh viên, bài Âm Vị Tiếng Việt đã được xữ dụng để kiểm chứng lại mức độ chính xác của hệ thống, xin tóm lược phần có liên quan như sau:
“Mô hình ngữ âm hiện tại (cổ điển). (TK 3)
Nhận xét
Mô hình hiện tại gồm tổng cộng 44 phones (27 phụ âm + 12 nguyên âm + 5 thanh).
Số phones này khá nhỏ, nhỏ hơn hầu hết các tập phones được sử dụng trong việc nhận dạng các ngôn ngữ khác trên thế giới. Điều này giúp làm giảm áp lực về yêu cầu độ lớn của bộ dữ liệu huấn luyện mô hình ngữ âm.
Thử nghiệm mô hình ngữ âm mới
Phụ âm gồm 23 phụ âm:
b c ch d đ g h kh l m n ng nh p ph qu r s t th tr v x
Nguyên âm gồm có 47 nguyên âm
a â ă ai ao au âu ay ây e ê eo êu i ia iê iêu iu o ơ oa oă oai oay oe oi ôi ơi oo u ư ua uâ ưa uê ui ưi uô uơ ươ uôi ươi ươu ưu uy uya uyê
Nhận xét
▪Gồm 75 phones [23 phụ âm, 47 nguyên âm và 5 thanh]. Số phones lớn hơn hẳn so với mô hình ngữ âm trước đây, điều này đưa ra yêu cầu là phải có bộ dữ liệu cũng phải lớn tương ứng để huấn luyện cho mô hình ngữ âm.
▪Áp dụng được đặc điểm đơn âm của tiếng Việt để biểu diễn những từ có độ dài phát âm gần giống bằng số trạng thái gần giống nhau. Ví dụ chữ “xuyên” và chữ “xin”, chúng có độ dài phát âm gần như bằng nhau và đều được biểu diễn bởi 3 hmm với 9 trạng thái.
▪Những âm được phát âm giống nhau sẽ được phiên âm thành một âm duy nhất. Việc xác định là âm nào sẽ được thực hiện bởi mô hình ngôn ngữ kèm với từ điển phiên âm.
Tài liệu tham khảo của bài trên
Tiếng Việt
1. Đoàn Văn Phi Long, Âm vị tiếng Việt,http://www.vn.net/article.php/200607140815151597, 2004.
2. Nguyễn Hoàng Dũng, Nguyễn Cao Trường Hải, Một số cải tiến nâng cao chất lượng cho hệ thống
nhận dạng tiếng Việt, Luận văn tốt nghiệp khoá 02 khoa Công nghệ thông tin, TPHCM, 2006.
3. Nguyễn Quang Vinh, Tự động tìm kiếm đơn vị ngữ âm cho bài toán nhận dạng tiếng nói tiếng Việt
liên tục, Luận văn tốt nghiệp khóa 03 khoa Công nghệ thông tin, TPHCM, 2007.
4. Trần Ngọc Dụng, Tìm hiểu ngữ âm tiếng Việt
Tiếng Anh
1. A Stolcke, SRILM - An Extensible Language Modeling Toolkit, Proc. Intl. Conf. Spoken Language
Processing, Denver, Colorado, September, 2002
2. C H Lee, F. K. Soong, and K. K. Paliwal, Automatic Speech and Speaker Recognition, Advanced
Topics, pages 1-30. Kluwer Academic Publishers, 1996 etc… ”

Như vậy mức độ chính xác của bài “Âm vị tiếng Việt” đã được kiểm chứng bằng khóa luận
tốt nghiệp Công nghệ thông tin chuyên ngành kỹ thuật phần mềm (software).
Vẫn như cũ 15 năm sau, lên mạng tìm lại âm vị tiếng Việt coi ra sao thì tình trạng không có gì thay đổi. Có hằng trăm mạng nói về âm vị tiếng Việt nhưng diễn tả vòng vo, rườm rà và không cho biết tổng số âm vị tiếng Việt là bao nhiêu và đếm ra sao.
Riêng Trung Hoa có tiến bộ hơn một chút:
Âm vị tiếng Trung Hoa
Để trả lời câu hỏi trên mạng: Có bao nhiêu nguyên âm, nhị trùng âm và phụ âm trong tiếng Trung Hoa Mandarin?, một người Trung Hoa dùng mobile phone và bằng loại chữ Hanyu
Pinyin, ngày 28 Dec 2017, liệt kê các âm vị như sau:
9 vowels
a e i u ü -i(in zhi, chi, shi) -i(in zi, ci, si) ê er
(Vài người cho "-i"s are not vowels, so 7.)
9 diphthongs
ai ei ao ou ia ie ua uo üe
22 consonants
b p m f d t n(-n) l g k h j q x zh ch sh r z c s -ng
Tổng cộng có 40 âm vị (TK 4)
Xin liệt kê các nước khác để so sánh

Âm vị Âu châu
Albanian 37, Basque 30, Belarusian 48,
Bulgarian 44, Catalan 36, Czech37,
Danish 52, English36, Dutch 39,
Finnish 34, French 39, German 45,
Greek 23, Hungarian 41, Italian 30,
Lithuanian 59, Portuguese 37, Russian 40,
Spanish (Castilian) 25, Swedish 35,
Ukrainian 40, Welsh 45
Vài ngôn ngữ không Âu Châu để so sánh
Arabic 34, Chinese (Mandarin) 35, Hindustani 48,
Persian 32, Japanese 32, Turkish 31
15 nước đứng đầu về tổng số âm vị:
1. Lithuanian : 77
2. Estonian : 75
3. Welsh : 62
4. Belarusian : 58
5. Russian : 55
6. Danish, Finnish : 52
7. Norwegian : 50
8. English, Icelandic, Irish Gaelic, Latvian, Romanian : 49
9. Dutch, German, Ukrainian : 48 (TK 5)

Tham Khảo
1. Thai phrase book & dictionary và Cambuchia phrase book & dictionary của nhà xuất bản Lonely Planet.
2. Phoneme Codes, International Phonetic Alphabet
en.wikipedia.org/wiki/International_Phonetic_Alphabet
3. Trường Đại học Khoa học tự nhiên, khoa Công nghệ thông tin HCM, khóa luận tốt nghiệp chuyên ngành kỹ
thuật phần mềm, luận án cử nhân áp dụng vào Âm vị tiếng Việt.
4. Âm vị Trung Hoa
 quora.com/How-many-vowels-diphthongs-and-consonants-does-Mandarin-Chinese-have
5.Europe phoneme eupedia.com/linguistics/number_of_phonemes_in_european_languages.shtml

No comments:

Post a Comment