Dấu câu, còn có tên gọi khác là dấu chấm[1] (nay dùng để chỉ dấu "."), dấu chấm câu,[2] là cách sử dụng khoảng trắng, các ký hiệu quy ước và các thiết bị đánh máy nào đó để hỗ trợ việc đọc (đọc lớn hoặc đọc thầm) và hiểu đúng các đoạn văn bản in ấn hoặc viết tay.[3]
Một khái niệm khác định nghĩa: "Dấu câu là một thói quen, hành động hay hệ thống của việc chèn các điểm và các ký hiệu nhỏ khác vào các đoạn văn bản, để hỗ trợ sự diễn dịch, phân chia văn bản thành các câu, mệnh đề,... bằng các dấu câu, chẳng hạn như dấu chấm."[4]
Trong văn viết, dấu câu rất quan trọng để phân biệt ý nghĩa của câu. Mỗi ngôn ngữ có quy tắc về cách đặt dấu câu khác nhau. Các tác giả có thể sử dụng các phương án đặt dấu câu khác nhau để giúp bài đọc được hay hơn và với ý nghĩa châm biếm khác nhau.
Lịch sử
Các hệ thống chữ viết đầu tiên là từ phù hoặc âm tiết - chẳng hạn như tiếng Trung và Hệ chữ Maya - không nhất thiết phải có dấu câu, đặc biệt là dấu cách. Nguyên do là toàn bộ hình vị hoặc từ thường được gom nhóm lại thành một ký tự đơn nhất, vì vậy dấu cách không giúp ích cho việc phân biệt từ. Khi giao tiếp, chỉ cần ngắt quãng câu hoặc nhấn mạnh mà không cần dấu câu, cũng đã có thể phân tách từng vùng của câu thành một cụm có nghĩa để người nghe hiểu.
Các văn bản cổ của Trung Hoa xưa hiện còn lưu truyền không cần dấu chấm câu. Tuy nhiên, nhiều văn bản khắc trên tre thời Chiến Quốc có chứa các ký hiệu ⟨└⟩ (cho biết cuối chương) và ⟨▄⟩ (cho biết dấu chấm).[5] Đến triều đại nhà Tống, việc các học giả thêm dấu câu vào văn bản để dễ hiểu hơn đã trở nên phổ biến.[6]
Bảng chữ cái viết tay sớm nhất là tiếng Phoenicia, tiếng Do Thái và những tiếng khác cùng họ ngôn ngữ, không có viết hoa, không có dấu cách, không có nguyên âm (xem abjad) và ít dấu câu. Việc này có hiệu quả miễn là chủ đề được giới hạn trong một phạm vi nhất định (ví dụ: văn bản được sử dụng để ghi lại các giao dịch).
Mesha Stele được xem là tài liệu cổ nhất sử dụng dấu câu (thế kỷ IX TCN).[7]
Văn cổ phương Tây
Hầu hết các văn bản vẫn được viết bằng scriptura continua, tức là không có bất kỳ sự phân tách nào giữa các từ. Tuy nhiên, người Hy Lạp đôi lúc sử dụng các dấu câu bao gồm các dấu chấm được xếp theo chiều dọc — thường là hai (dicolon) hoặc ba (tricolon) — vào khoảng thế kỷ V TCN để hỗ trợ trong việc chuyển tải văn bản bằng miệng. Các nhà viết kịch người Hy Lạp như Euripides và Aristophanes đã sử dụng ký hiệu để phân biệt phần cuối của các cụm từ trong kịch viết (cơ bản để giúp diễn viên biết khi nào nên ngắt câu). Sau năm 200 trước Công nguyên, người Hy Lạp sử dụng hệ thống của soạn giả Aristophanes thành Byzantium (được gọi là théseis) - một dấu chấm đơn tên (punctus):
hypostigmḗ – punctus thấp để đánh dấu một komma (đơn vị nhỏ hơn mệnh đề);
stigmḕ mésē – punctus trung để đánh dấu một (kōlon);
stigmḕ teleía – punctus cao để đánh dấu một câu (periodos).[8]
Ngoài ra, người Hy Lạp đã sử dụng ký hiệu paragraphos (hoặc gamma) để đánh dấu phần đầu câu, diple để biểu thị phần trích dẫn và koronis để biểu thị phần cuối của các đoạn.
Người La Mã (khoảng thế kỷ I TCN) cũng thỉnh thoảng sử dụng các ký hiệu này, trong khi đó théseis của người Hy Lạp - dưới tên gọi distinctiones '[9] - đã thịnh hành vào thế kỷ IV sau Công nguyên theo bản viết của Aelius Donatus và Isiđôrô (thế kỷ VII). Ngoài ra, đôi khi các văn bản có dấu per capitula, khi mỗi câu xuống dòng. Diple cũng được sử dụng, nhưng sau này nó bị biến thành dấu phẩy.
Thời Trung cổ
Số lượng dấu câu phát triển đáng kể khi số lượng lớn các bản sao của Kinh thánh bắt đầu được sản xuất. Chúng được thiết kế để đọc, vì vậy người chép lại các tài liệu bắt đầu cho ra đời một loạt các ký hiệu dấu để hỗ trợ người đọc, bao gồm thụt đầu dòng, các dấu câu khác như: diple, paragraphos, simplex ductus ..., và phiên bản sơ khai của các chữ in hoa (litterae notabiliores). Jerome và các đồng nghiệp của ông - những người đã dịch Kinh thánh sang tiếng Latinh, Vulgate (khoảng năm 400 sau Công nguyên), đã sử dụng một hệ thống bố cục mới cho bài phát biểu của Demosthenes và Cicero. Theo bố cục per cola et commata, mọi đoạn văn đều thụt lề vào. Bố cục này chỉ được sử dụng cho các bản thảo Kinh thánh trong suốt thế kỷ V-IX nhưng không còn xài khi dấu chấm câu xuất hiện.
Trong các thế kỷ VII-VIII, người Ireland và người Anglo-Saxon, đây là dân tộc mà tiếng mẹ đẻ không bắt nguồn từ tiếng Latinh, đã thêm nhiều ký hiệu hơn để văn bản dễ hiểu hơn. Các nhà ghi chép lại văn bản người Ireland đã giới thiệu phương pháp tách từ.[10] Phổ biến nhất là punctus (ký hiệu kiểu dấu phẩy) và dấu 7 hình (comma positura), thường được sử dụng nối kết câu.
Vào cuối thế kỷ VIII, một hệ thống khác đã xuất hiện ở Pháp dưới Vương triều Caroling. Ban đầu để chỉ chỗ giọng nói điều biến khi tụng phụng vụ, positurae có trong các văn bản có nghĩa là để đọc to, rồi có mặt trên tất cả các bản thảo viết tay. Positurae du nhập vào Anh lần đầu tiên vào cuối thế kỷ X, có thể là trong phong trào cải cách Benedictine, nhưng không được chấp thuận sử dụng cho đến sau khi Norman xâm lược. Positurae đầu tiên bao gồm punctus, punctus elevatus,[11]punctus versus, và punctus interrogativus; còn ký hiệu thứ 5, punctus flexus được sử dụng vào thế kỷ X để biểu thị việc ngắt câu giữa punctus và punctus elevatus. Vào cuối thế kỷ XI, đầu thế kỷ XII, punctus versus biến mất và được thay thế bởi ký hiệu punctus đơn giản.[12]
Cuối thời Trung cổ có một ký hiệu mới là virgula suspensiva (gạch chéo hoặc gạch chéo với một dấu chấm ở giữa), thường được sử dụng cùng với punctus.
Thời kỳ báo in
Số lượng tài liệu in và độc giả bắt đầu tăng lên sau khi phương pháp in "movable" ra đời ở châu Âu vào những năm 1450. Theo giải thích của nhà văn kiêm biên tập viên Lynne Truss: "Sự gia tăng việc in ấn trong thế kỷ XIV và XV nhất thiết phải có một hệ thống dấu câu tiêu chuẩn."[13] Sách in có các chữ cái kích thước như nhau, có thể đọc nhanh hơn nhiều so với các bản viết tay. Đọc nhanh hoặc đọc to không có thời gian để phân tích cấu trúc câu. Với tốc độ này dẫn đến việc sử dụng nhiều hơn và cuối cùng là tiêu chuẩn hóa dấu câu.
Sự ra đời của một hệ thống dấu câu tiêu chuẩn cũng được cho là nhờ nhà in người Venice Aldus Manutius và cháu trai của ông. Họ đã phổ biến phương pháp kết câu bằng dấu hai chấm hoặc dấu chấm, phát minh ra dấu chấm phẩy, thỉnh thoảng sử dụng ngoặc đơn và tạo ra dấu phẩy hiện đại. Đến năm 1566, Aldus Manutius the Younger đã có thể tuyên bố rằng đối tượng chính của dấu câu là phân loại cú pháp.[14]
Đến thế kỷ XIX, dấu câu ở phương Tây đã phát triển "để phân loại các dấu theo thứ bậc, về trọng lượng âm".[15]
Việc tiêu chuẩn hóa dấu câu bắt đầu khi phát minh ra máy in. Trong sách hướng dẫn về typography (kiểu chữ) vào thế kỷ XIX, Thomas MacKellar viết:
Ngay sau khi phát minh việc in ấn, sự cần thiết của việc kết hoặc ngắt câu để người đọc hiểu đã tạo ra dấu hai chấm và dấu chấm. Theo thời gian, dấu phẩy đã được thêm vào, khi đó nó chỉ đơn thuần là một đường vuông góc. Ba dấu này là những dấu duy nhất và đầu tiên được sử dụng cho đến cuối thế kỷ XV, khi Aldo Manuccio đưa ra hình dạng đẹp hơn cho dấu phẩy, và ngoài ra thêm dấu chấm phẩy; dấu phẩy biểu thị khoảng dừng ngắn nhất, tiếp theo là dấu chấm phẩy, sau đó là dấu hai chấm và kết thúc câu bằng dấu chấm.[16]
Máy đánh chữ và giao tiếp điện tử
Sự ra đời của máy điện báo với bộ mã hạn chế[17] và máy đánh chữ với một số phím hạn chế ảnh hưởng đến dấu câu. Ví dụ: dấu ngoặc kép và dấu viết lược đều được thu gọn thành hai ký tự (' và "). Dấu gạch nối, dấu trừ và dấu gạch ngang có độ rộng khác nhau đã được thu gọn thành một ký tự duy nhất (-), đôi khi được xài lại để biểu thị một dấu gạch ngang dài. Dấu cách có độ rộng khác nhau ở các máy sắp chữ chuyên nghiệp đã được thay thế bằng độ rộng giữa các ký tự với kiểu chữ monospace. Trong một số bàn phím máy đánh chữ không có dấu chấm than (!) nên vì thế sử dụng phương pháp Đánh chữ chồng qua phím dấu nháy lược và phím dấu chấm; mã Morse ban đầu không có dấu chấm than.
Những đơn giản hóa này đã được tiếp chuyển sang cách viết kỹ thuật số với máy điện báo ghi chữ và bộ ký tự ASCII về cơ bản hỗ trợ các ký tự giống như máy đánh chữ. (Hiện nay khuyến khích không nên có 2 khoảng trắng và một số công cụ viết điện tử, bao gồm cả phần mềm của Wikipedia, tự động chuyển khoảng trắng đôi thành đơn). Mặc dù các bộ ký tự như Unicode hỗ trợ dấu câu phổ biến rộng rãi, các tin nhắn văn bản có xu hướng sử dụng kiểu dấu câu ASCII đơn giản với việc bổ sung các ký tự như emoji.
Trong kỷ nguyên máy tính, các ký tự dấu câu được tái thiết để sử dụng trong ngôn ngữ lập trình và URL. Do được sử dụng trong email và Twitter, a còng (@) đã từ một ký tự ít người biết đến thành một ký tự rất phổ biến được sử dụng phổ biến cho định tuyến kỹ thuật.
Dấu chấm câu không được sử dụng trong tiếng Trung, tiếng Nhật, tiếng Hàn và tiếng Việt hệ chữ Nôm cho đến dấu chấm câu từ phương Tây du nhập vào cuối thế kỷ XIX và đầu thế kỷ XX. Trong các văn bản không có chấm câu, cấu trúc ngữ pháp của câu trong văn bản cổ điển được suy ra từ ngữ cảnh.[18] Hầu hết các dấu câu trong tiếng Trung Quốc, Nhật Bản và Hàn Quốc hiện đại có chức năng tương tự như dấu câu tiếng Anh; tuy nhiên chúng thường trông khác nhau và có các quy tắc khác nhau.
Có hai kiểu dấu chấm câu chính trong tiếng Anh: kiểu Anh hoặc kiểu Mỹ. Hai kiểu này khác nhau chủ yếu ở cách xử lý dấu ngoặc kép, đặc biệt là khi kết hợp với các dấu câu khác. Trong tiếng Anh Anh, các dấu câu như dấu chấm và dấu phẩy chỉ được đặt bên trong dấu ngoặc kép nếu chúng là một phần của nội dung đang được trích dẫn và được đặt bên ngoài dấu ngoặc kép nếu là một phần của câu chứa nó. Tuy nhiên, trong tiếng Anh Mỹ, những dấu câu như vậy thường được đặt bên trong dấu ngoặc kép bất kể lúc nào.[19]Dấu phẩy nối tiếp được sử dụng thường xuyên ở Hoa Kỳ hơn là ở Anh.
Các ngôn ngữ của châu Âu khác sử dụng nhiều dấu câu giống như tiếng Anh. Sự giống nhau mạnh mẽ đến mức một vài biến thể có thể gây nhầm lẫn cho người đọc tiếng Anh bản ngữ. Dấu ngoặc kép có thay đổi ở vài ngôn ngữ châu Âu. Ví dụ: trong tiếng Pháp và tiếng Nga, dấu ngoặc kép sẽ xài ở dạng: «Je suis fatigué.».
Trong tiếng Hy Lạp, dấu chấm hỏi được viết dưới dạng dấu chấm phẩy tiếng Anh, trong khi chức năng của dấu hai chấm và dấu chấm phẩy được thực hiện bởi dấu chấm lửng ⟨·⟩, với cái tên ano teleia (άνω τελεία).
Trong tiếng Gruzia, các dấu 3 chấm, ⟨჻⟩, trước đây được sử dụng để phân cách câu hoặc đoạn văn. Nó đôi khi vẫn được sử dụng trong thư pháp.
Tiếng Tây Ban Nha và tiếng Asturias (cả hai là nhóm ngôn ngữ Rôman được sử dụng ở Tây Ban Nha) sử dụng dấu hỏi đảo ngược ⟨¿⟩ ở đầu câu hỏi và dấu chấm hỏi bình thường ở cuối, cũng như dấu chấm than đảo ngược ⟨¡⟩ ở đầu câu cảm thán và dấu chấm than bình thường ở cuối.[20]
Tiếng Armenia sử dụng một số dấu câu của riêng nó. Dấu chấm đầy đủ được biểu thị bằng dấu hai chấm và ngược lại; dấu chấm than được thể hiện tương tự như dấu ngã ⟨~⟩, trong khi dấu chấm hỏi ⟨՞⟩ giống một vòng tròn không khép kín được đặt sau nguyên âm cuối cùng của từ.
Tiếng Ả Rập, tiếng Urdu và tiếng Ba Tư - được viết từ phải sang trái — sử dụng dấu hỏi ngược: ⟨؟⟩ và dấu phẩy ngược: ⟨،⟩. Đây là một sự đổi mới hiện đại; tiếng Ả Rập tiền hiện đại không sử dụng dấu chấm câu. Tiếng Do Thái, cũng được viết từ phải sang trái, sử dụng các ký tự giống như trong tiếng Anh, ⟨,⟩ và ⟨?⟩.[21]
Ban đầu, tiếng Phạn không có dấu chấm câu. Vào thế kỷ 17, tiếng Phạn và tiếng Marathi, đều được viết bằng Devanagari, bắt đầu sử dụng thanh dọc ⟨।⟩ để kết thúc một dòng văn xuôi và thanh dọc kép ⟨॥⟩ trong câu.
Ở tiểu lục địa Ấn Độ, ⟨:-⟩ đôi khi được dùng thay cho dấu hai chấm. Nguồn gốc của nó chưa rõ nhưng có thể là tàn tích của Raj thuộc Anh. Một dấu câu khác phổ biến ở Tiểu lục địa Ấn Độ để viết số tiền là việc sử dụng dấu ⟨/-⟩ hoặc ⟨/=⟩ sau số. Ví dụ, Rs. 20/- hoặc Rs.20/= ngụ ý toàn bộ 20 rupee.
Năm 1962, Giám đốc điều hành quảng cáo người Mỹ Martin K. Speckter đã đề xuất interrobang (‽), một sự kết hợp giữa dấu chấm hỏi và dấu chấm than, để thể hiện sự không tin tưởng. Mặc dù dấu câu mới này đã được bàn tán rộng rãi vào những năm 1960, nhưng nó không được sử dụng rộng rãi.[22]
"Dấu chấm yêu" và ký hiệu tương tự
Vào năm 1966, nhà văn người Pháp Hervé Bazin đề xuất một loạt sáu dấu câu sáng tạo trong cuốn sách của mình Plumons l'Oiseau ("Let's pluck the bird" (Hãy nhổ lông chim), 1966).[23] Chúng bao gồm:[24]
Dấu "mỉa mai" (point d'ironie: )
Dấu "tình yêu" (point d'amour: )
Dấu "xác tín" (point de conviction: )
Dấu "d'autorité" (point d'autorité": )
Dấu "chấm than" (point d'acclamation: )
Dấu "thắc mắc" (point de doute: )
"Dấu phẩy câu hỏi", "Dấu phẩy cảm thán"
Đơn xin cấp bằng sáng chế quốc tế đã được nộp và xuất bản vào năm 1992 theo Tổ chức Sở hữu Trí tuệ Thế giới (WIPO) số WO9219458,[25] cho hai dấu câu mới: "dấu phẩy câu hỏi" và "dấu phẩy cảm thánh". Chúng được thiết kế để sử dụng như dấu chấm hỏi và dấu chấm than trong một câu, một chức năng mà dấu chấm hỏi và dấu chấm than bình thường cũng có thể được sử dụng, nhưng có thể bị coi là lỗi thời. Đơn xin cấp bằng sáng chế chỉ được áp dụng cấp quốc gia ở Canada. Nó đã mất hiệu lực ở Úc vào ngày 27 tháng 1 năm 1994[26] và ở Canada vào ngày 6 tháng 11 năm 1995.[27]
^E. Otha Wingo, Latin Punctuation in the Classical Age (The Hague, Netherlands: De Gruyter, 1972), 22.
^Tên Latinh cho các ký tự này là: subdistinctio, media distinctio và distinctio.
^Parkes, M. B. (1991). “The Contribution of Insular Scribes of the Seventh and Eighth Centuries to the 'Grammar of Legibility'”. Scribes, Scripts and Readers: Studies in the Communication, Presentation and Dissemination of Medieval Texts. London: Hambledon Press. tr. 1–18.
^MacKellar, Thomas (1885). The American Printer: A Manual of Typography, Containing Practical Directions for Managing all Departments of a Printing Office, As Well as Complete Instructions for Apprentices: With Several Useful Tables, Numerous Schemes for Imposing Forms in Every Variety, Hints to Authors, Etc . Philadelphia: MacKellar, Smiths & Jordan. tr. 63.
Patt, Sebastian (2013). Punctuation as a Means of Medium-Dependent Presentation Structure in English: Exploring the Guide Functions of Punctuation. Tübingen: Narr Francke Attempto Verlag. ISBN978-3-8233-6753-6.