Проект:Внесение символов алфавитов народов России в Юникод
Этот проект неактивен. Информацию по восстановлению неактивного проекта см. здесь. Если активность проекта увеличится или данный шаблон был проставлен по ошибке, замените параметр неактивный на малоактивный или активный, замените дату на сегодняшнюю, а также обновите статус активности в каталоге проектов. (Шаблон установлен 18 октября 2017 года)
Как известно, история письменности народов России интересна, и, к сожалению, плохо изучена на Западе. Поэтому в Юникод не был включён ряд букв алфавитов народов России. Однако в академических целях необходимо представить все буквы, в том числе и упразднённые (кстати, упразднённые буквы собственно русского языка внесены в Юникод). С этой целью предполагается собрать базу данных по этим символам, чтобы в дальнейшем, организованно и чётко, подать запрос на их включение в кодировку Юникод.
Пожалуйста, оставляйте все возникающие вопросы и предложения прямо здесь, а не на странице обсуждения.
4 апреля вышел Юникод 5.1. Некоторые из добавленных букв кириллицы можно посмотреть здесь: [4].
На связь вышел отец-основатель Юникода, Майкл Эверсон, Участник:Evertype. Очень надеемся на его помощь!!!
Наш грузинский соратник, Нелли Мелкадзе, отсканировала страницы осетинских и абхазских книг на грузинской графике в высоком разрешении. В данный момент сканы находятся у меня, два из них, демонстрирующие специфические осетинские буквы, отсутсвующие в Юникоде, я выложил сюда.
Добавлено изображение раздельного арабского письма (вернее, печати), существовавшего в Татарской АССР в 1920-х.
Совместно с Карлом Пентцлиным была написана заявка на внесенее недостащих букв татарского Яналифа.
Яналиф - латинский алфавит, использовавшийся для татарского, башкирского и других языков СССР в 1920-1930е годы. Большая часть букв совпадает с собственно латинским, некоторые - с расширенным латинским алфавитом. Известно, что Эссой Антикоски был в своё время создан шрифт Times Janalif, что помогло бы разработчикам Юникода, однако на моём компьютере он потерялся, у других его не было, а связь с Эссой потеряна :(. --Untifler14:41, 11 октября 2006 (UTC)[ответить]
Буквы Яналифа, отсутствующие в Юникоде
Помещайте сюда буквы латинских алфавитов народов СССР в 1920-1930-е годы с их описанием и предполагаемым названием
Буква представляет собой комбинацию латинской буквы N и хвостика, как в буквах кириллицы Щ, Ц, Җ, Ң. Не стоит путать букву с Ŋŋ. Аналог в кириллице: Ң.
Буква использовалась в различных латинских алфавитах языков народов Советского Союза в период латинизации, в частности, в татарском Яналифе. Первое известное мне упоминание - 1924 год - проект татарско-башкирской латиницы, опубликованный в газете "Эшче". Она присутствовала во всех проектах татарской латиницы 1920х. Использовалась в 1927-1940 годах в татарском языке, а также в большинстве тюркских алфавитов 1920-30-х годов.
В "официальной" новой татарской латинице от 2000 года также предполагалось использовать эту букву, в шрифтах, рекомендованных Кабмином РТ буква находилась на позиции символа Ññ. Качество шрифтов оставляет желать лучшего, но всё же лучше чем ничего.
Dotless I With Right Bowl (Ы)
LATIN CAPITAL LETTER DOTTLES I WITH RIGHT BOWL
LATIN SMALL LETTER DOTTLES I WITH RIGHT BOWL
Буква соответствует Ы в кириллице, а выглядит как кириллический мягкий знак, один в один. Не стоит путать с Ƅƅ (Latin Letter Tone Six). Употреблялась только в 1927-1940 годы, только в Яналифе, в латинице 2000 года использование не предполагалось.
Может лучше назвать типа LATIN CAPITAL/SMALL LETTER CYRILLIC-LIKE SOFT SIGN?
Из этого перевода следует, что это "мягкий знак как в кириллице". Но это не мягкий знак, а буква "ы". Кстати была в башкирском буква, похожая на "ять".. но это просто английская th. --Untifler15:09, 14 октября 2006 (UTC)[ответить]
Dotless I With Right Bowl J ligature (ЫЙ)
Вышеуказанный символ в сочетании с J считался согласно некоторым источникам отдельной буквой.
За все яналифные письменности утверждать не буду, но вот в крымскотатарском варианте Яналифа строчная буква B писалась как в, а не как b (чтобы не возникало путаницы строчной В - b с заглавным "мягким знаком" - Ь). То есть яналифная В в тождественно совпадает по написанию с кириллической В в. Но раз решено делать отдельную букву для Ь ь, которая тоже не отличается от мягкого знака, то тогда нужно и для В в тоже делать.
По непроверенной информации, в некотрых яналифных алфавитах (я слышал такое про туркменский) строчная L писалась не как l, а как уменьшенная копия заглавной буквы (по аналогии с в, чтобы не было путаницы строчной L - l и заглавной i - I). Если это действительно так, то тогда нужна ещё одна буква.
Буквы, употреблявшиеся в 1927-1928 годы и неиспользовавшиеся буквы
Яналиф образца 1927 года содержал букву, выглядевшую как русская Ш ш, читалась и писалась она точно также как и в кириллице. В 1928 произошла ещё одна реформа, уже латинского, алфавита и букву упразднили. То, что такая буква была, задокументировано, однако я ни разу не видел текст, где бы эта буква применялась - это был короткий период. --Untifler15:22, 13 октября 2006 (UTC)[ответить]
LATIN CAPITAL LETTER SHA
LATIN SMALL LETTER SHA
Есть ещё одна буква. Однозначно, что на письме она не использовалась, она только была предложена в проекте от 1924 года. Не исключаю, что как латинская она ещё где-то применялась, так что в академических целях было бы непохо добавить в Юникод и её. Как её назвать по-английски я даже не знаю. Выглядела она как Э э в кириллице. Читалась как современная татарская Э э. Предположим, пусть будет
LATIN CAPITAL LETTER REVERSED CYRILLIC-LIKE E
LATIN SMALL LETTER REVERSED CYRILLIC-LIKE E
Башкирский яналиф
Текст на башкирском
Башкирский Яналиф во многом совпадает с татарским, но в нём присутствуют ещё 3 буквы, не описанные ранее ("к","з" и "с" с хвостиками):
Кто добавил "К"? она действительно чем-то оличалась? Пожалуйста, пишите, даже если вы не уверены в информации, но обязательно приводите источники! --Untifler13:16, 9 декабря 2006 (UTC)[ответить]
Участник Noorlan. Это явная опечатка поскольку татарский и башкирский яналиф отличались в конце тридцатых годов только двумя буквами "з" и "с" с хвостиками.
Не, это же "Же", Нурлан явно имеет в виду что-то другое!
Не стоит путать понятие символов со звуками, которые они обозначают в конкретном языке. В данном случае, использовалась латинская Z с со средней чертой, как и написано выше. --Prounn19:46, 14 ноября 2014 (UTC)[ответить]
Башкирское Th (ҫ)
LATIN CAPITAL LETTER T WITH RIGHT BOWL
LATIN SMALL LETTER T WITH RIGHT BOWL
Строчная буква напоминает комбинацию t и b. А вот прописная буква напоминает русскую "ять" (Ѣ). Правда лично мне до сих пор не ясно - это был такой стандарт - или свойство какого-либо отдельного шрифта…--Untifler14:17, 15 октября 2006 (UTC)[ответить]
Уточняю не только прописная но и строчная, обозначались буквой "ять". Это относится и к способу курсивного написания указанной буквы - она совпадает с курсивной "ять" до революционной орфографии - чтото типа iь--Noorlan15:16, 23 декабря 2006 (UTC)[ответить]
Ну, это может быть не самый лучший вариант: ведь например курсивная буква выглядела совсем не похоже на b. Так что если дело дойдет до proposal , то нужно его составлять на оба, строчный и прописной варинаты.--Untifler11:55, 12 июня 2008 (UTC)[ответить]
Башкирское Dh (ҙ)
LATIN CAPITAL LETTER D WITH RIGHT STROKE
(соответствующая маленькая буква В Юникоде уже есть)
Очевидно, что эту букву надо вносить как отдельную: т.к. "перекладинка" находится не на "ножке", как у уже имеющихся букв, а на "дужке".--Untifler14:17, 15 октября 2006 (UTC)[ответить]
И эту тоже надо вводить и строчную, и прописную! Её курсивная форма выглядела как что-то вроде совмещенного d и і!
Абхазская латиница с соответствиями из кириллицы и МФА
Я тут внёс некоторые предложения, как назвать буквы (кроме имеющихся и описанных выше). Понятное дело, нужна помощь носителей языка, знакомых с этим алфавитом, чтобы иметь представление каким звукам эти буквы соответствуют, чтобы правильно задать все имена букв. --Untifler15:06, 13 октября 2006 (UTC)[ответить]
Я добавил произношение и кириллицу. Красным выделено то, что в моем источнике отличается от того, что выше. По поводу названий, может не писать (здесь) каждый раз по отдельности большие и маленькие буквы? Это ж не спецификация для подачи в Юникод. Ну, кроме тех случаев если они как-то по-разному представлены в Юникоде. Я кое-где исправил названия, отметил полужирным. --Koryakov Yuri15:10, 22 октября 2006 (UTC)[ответить]
Интересно... Кстати, почему-то видны не все таблицы, обидно... однако этот источник может послужить и для архаичной абхазской кириллицы... Насщёт small/capital - ну да, это можно... --Untifler15:37, 23 октября 2006 (UTC)[ответить]
LATIN SMALL SMALL LETTER G WITH HOOK - ?? - неет такая буква есть под названем LATIN SMALL LETTER G WITH HOOK, однако соответтсвующая ей LATIN CAPITAL LETTER G WITH HOOK выглядит похоже на G --Untifler13:23, 24 октября 2006 (UTC)[ответить]
Ревизия чеченского алфавита образца 1925 года (алфавит Ошаева [5])показала, что там нет знаков, которые бы отсутствовали в Юникоде. Однако есть разночтение по одному символу в разных источниках, непонятно, какой символ был в алфавите сразу после x: x̌ или x́. Кстати, оба символа являются комбинированными символами: состоят из буквы x и "combining breve" ( ̆) "combining acute" ( ́́). Так что добавлять тут вроде бы пока нечего, да и неизвестно чего.
Извиняюсь, оказывается оба символа широко применяются в транслитерациях языков народов Северного Кавказа, да и в ингушском языке этот символ был… См раздел "Ингушская латиница". --Untifler15:33, 16 октября 2006 (UTC)[ответить]
И скорее всего над х не дужка, а галочка:
X̌
LATIN CAPITAL LETTER X WITH CARON
1992 год
Чеченский алфавит 1992 года
Латиницу 1992 года наверное нельзя отнести к "историческим" алфавитам. Поэтому, как мне кажется, хоть её символы точно также можно представить как комбинированные, их всё-таки нужно внести в Юникод. Тем более, что тут всё очевидно.
Ç̇ ç̇
LATIN CAPITAL LETTER C WITH CEDILLA WITH DOT ABOVE
LATIN SMALL LETTER C WITH CEDILLA WITH DOT ABOVE
Q̇ q̇
LATIN CAPITAL LETTER Q WITH DOT ABOVE
LATIN SMALL LETTER Q WITH DOT ABOVE
Для интересующихся вайнахским (чеченским и ингушским) латинским алфавитом: в современных условиях отсутствия в системе юникод отдельных букв Ç̇ ç̇ (C WITH CEDILLA WITH DOT ABOVE), Q̇ q̇ (Q WITH DOT ABOVE), вайнахскими энтузиастами было принято решение временно использовать соответственно, Ḉḉ и Ǩ ǩ (или Ꝗ ꝗ, найденная пока лишь в шрифте Code2000). Появившаяся в юникоде, наряду с перечисленными, ингушская буква Ꜧ ꜧ (heng, имеющаяся в шрифтах Code2000, DejaVu Sans) полностью удовлетворяет потребности вайнахских языков в юникод-пространстве. rexxel@rambler.ru
Ногайская латиница существовала в 1928-1937 годы. По большей части она совпадает с другими тюркскими, однако некоторые символы рознятся. Так, существовал одно время символ для короткого "и", "ц" обозначалось также как в аварском. --Untifler14:21, 18 октября 2006 (UTC)[ответить]
Вообще-то, да, но ď и ť представлены. Почему одни буквы с диакритикой закодированы, а другие надо писать комбайнами? Ещё больше это относится к кириллице с диакритикой (ударения, макроны и т.п.)
Вообще, у меня к Юникоду очень много замечаний, просто ничего лучшего до сих пор нет. Комбайны в большинстве случаев отображаются просто безобразно, их можно использовать в крайних случаях, но регулярно ими печатать нельзя. Зато в Юникоде закодировано много чего не надо - дингбаты, стрелки, псевдографика, смайлики...
Как я понимаю хоть балкарски и диалект большого карачаево-балкарского языка, в Кабардино-Балкарии он используется именно как балкарский. И пишут там через ц и з, буква у́ там используется вместо ў. Ну если это так, то просто необходимо внести
CYRILLIC CAPITAL/SMALL LETTER U WITH ACUTE (У́ у́)
Кстати, хоть у карачаевского и балкарского один код - это не очень хорошо. Ведь если им одну Википедию выделят - будут спорить, через ц или ч писать... Есть ли у кого данные, есть ли в новых языковых кодах различные коды для этих двух диалектов? --Untifler20:23, 2 декабря 2006 (UTC)[ответить]
Участник Noorlan (noorlan(собачка)mail(точка)ru. В балкарии хоть и говорят [ц] вместо [ч] и [з] вместо [дж], но в письменности пишут только "ч" и "ж". Это факт, хотя первоначально тоже так думал. Относительно букв "у с краткой" и "у с ударением" они практически сейчас не употребляются. Нужно ещё отметить что более правильно она пишется "с запятой сверху", поэтому и называть её нужно как:
CYRILLIC CAPITAL/SMAL LETTET U WITH COMMA ABOVE
P.S. блин как вы делаете так чтобы автоматически указывалось имя участника и время?
Вот лигатуры, которые надо внести в Юникод. Очень прошу Amikeco внести свои дополнения: часть букв, приведённых в таблице Ironau.ru не совесем понятно как выглядят на самом деле :) --Untifler14:16, 18 октября 2006 (UTC)[ответить]
Помипо осетинского ([1]), использовалась также в сванском ([2]) и коми-зырянском([3])
Спасибо, понятно. но однако ж не совсем похожи те 4 буквы. К тому же т с галкой - это латиница, а не кириллица. А в Юникоде они строго разведены, вроде бы... Так что добавим. Кстати вот как они выглядят на самом деле.
Николай, а можешь на чувашском форуме спросить про это? может кто из участников отсканить какие-нибудь старые книги сможет или ещё что-нибудь.... --Untifler15:05, 14 октября 2006 (UTC)[ответить]
Спросил. Та ссылка, что ты представил, у меня не открывается. Еще, думается мне, можно внести символы рунической письменности. Енисейские, чувашские руны. ИМХО, даже кельтские (сорри, пишу по памяти) руны не представлены :) Николай Плотников (Обсуждение) 08:14, 15 октября 2006 (UTC)[ответить]
Так и ладно, пусть не открывается, я их уже в википедию закачал (см ниже). Тюркские руны и цифры в принципе тоже нужно, но как мне кажется это надо посылать отдельной порцией, ибо этот вопрос рассматриваться будет долго, как с тем же абуром. --Untifler11:30, 15 октября 2006 (UTC)[ответить]
О мордовской письменности сведений, к сожалению, очень мало, но известно что до реформы 1927 года букв в алфавите было больше. Ещё одной загадкой является тот факт, была ли латиница у мордвы, или же нет... --Untifler14:32, 15 октября 2006 (UTC)[ответить]
В Юникоде есть не все буквы даже для современных кириллических алфавитов народов России. Например для нивхского и ительменского. Эти алфвиты можно увидеть на [10]
Кроме того, оказывается есть современные буквы, которые набираются как комбинированные символы (тот же орокский, те же манси с 1980х)?There are some letters, that have macrons and are represented as combined symbols only. Surely, it is not appropriate for living, even minority languages such as en:Mansi language.
Orok block:
CYRILLIC CAPITAL/SMALL LETTER A WITH MACRON
CYRILLIC CAPITAL/SMALL LETTER IE WITH MACRON
CYRILLIC CAPITAL/SMALL LETTER O WITH MACRON
CYRILLIC CAPITAL/SMALL LETTER BARRED O WITH MACRON
(The context for this discussion was: Кроме того, оказывается есть современные буквы, которые набираются как комбинированные символы (тот же орокский, те же манси с 1980х)?There are some letters, that have macrons or breves and are represented as combined symbols only. Surely, it is not appropriate for living, even minority languages such as en:Mansi language and en:Khanty language dialects. (Copied from the previous section.))
В качестве замечаний от себя: Я, Ю и в особенности Ё в подавляющем большинстве шрифттов очень плохо сочетается с комбинированным макроном --Untifler11:24, 1 сентября 2008 (UTC)[ответить]
Так и должно быть. Газета печатается на новом алфавите хантыйского языка (хантыйский язык имеет 4 основных диалекта, каждый из которых имеет свой алфавит). Алфавит принят в 2000 году, газета перешла на него в 2004. Вот этот вот UKRAINIAN IE WITH DIAERESIS присутствует в казымском даилекте. Ещё в шурышкарском диалекте хантыйского языка есть особенный вариант буквы Л. Ссылка на гезту есть в статье Лух авт. Geoalex12:19, 1 сентября 2008 (UTC)[ответить]
Да, в казымском диалекте точно есть. Но звук типа очень редкий, поэтому встречается буква не часто. Там ещё есть Ю и Я с полукругами наверху (как в чувашском алвавите ӑ и ӗ). Шва с двоеточием и Я с полукругом есть на странице 2 газеты Ханты Ясанг №12 (на том же сайте)Geoalex06:42, 2 сентября 2008 (UTC)[ответить]
Спасибо за феерическую расстановку точек над буквами угров! Не можешь вкратце обозначить, в каких еще языках за последние 15 лет поменялась письменность?
Вроде бы была реформа нганасанского алфавита. Т.е. в 1990-е он был одним, а сейчас чуть-чуть другой. Чего-то там по мелочи мудрили у нанайцев и удэгейцев. Чукчам добавили "Л с хвостом". Вроде бы всё. Geoalex04:35, 4 сентября 2008 (UTC)[ответить]
Из современных - з̌ в нганасанском /Жовницкая-Турдагина С. Н. Ня’’ букварь. СПб., 1999./, д̌ в алеутском и куча букв (в̌, г̌, д̌, т̌, у̊, х̌) в шугнанском. Но это всё комбинируемые символы. А из старинных неохвачена огромная куча букв. Из того, что часто встречается больше всего нужна лигатура ДЖ и модификация буквы h (на картинке в статье хантыйская письменность она стоит между h и i. Geoalex05:25, 4 сентября 2008 (UTC)[ответить]
Ня’’ букварь? )) кавайненько )) насчет этих языков крайне интересно было бы узнать политику Юникода - ведь нкто же считает, что ё и й должны вводиться как комбинированные символы, так и тут - нужно ли их включать взапрос, или нет. Но опять таки, в языке ливов вся их жуткая диакритика была включена в Юникод и довольно давно, так почему бы и здесь хотябы не собрать всю информацию? можешь както систиматезировать эти данные и выложить либо сюда, либо куда-нибудь еще (и по кириллице, и по латинице)?--Untifler08:43, 4 сентября 2008 (UTC)[ответить]
В идеале надо сделать целый блок "Расширенные кириллические дополнения" с готовыми буквами с ударениями (а также макронами, кратками, грависами и т.п.) по типу латинских диакритик. --Jugydmort 14:58, 27 февраля 2012 (UTC)
Какой в них смысл, если всё можно сделать с помощью комбинирующих диакритик? Все возможные сочетания всё равно не переберёшь. — Monedula16:04, 19 марта 2012 (UTC)[ответить]
В современном юникоде есть блок (1D400..1D7FF) Mathematical Alphanumeric Symbols, куда включены латинский и греческий алфавиты, а также цифры, в различном написании (жирные, под наклоном, с засечками и без, ...) 13 вариантов для латиницы, 5 для греческих букв и 5 для цифр. Это очень удобно когда надо оформить текстовой файл, выделив некоторые слова жирным, курсивом и т.п. Думаю нужен аналогичный блок для кирилицы. Отец Евгений15:49, 19 марта 2012 (UTC)[ответить]
Эти жирные и курсивные буквы предназначены только для математических формул. В простом тексте надо использовать обычные средства форматирования. — Monedula16:04, 19 марта 2012 (UTC)[ответить]
Screw those bold, italic etc Cyrillic letters. What everyone here needs is missing subscripts (b, c, d, f, g, q, w, y, z and all the UPPERCASE letters from A to Z) and superscripts (q, C, F, Q, S, X, Y, Z) (>_<) 91.76.255.19213:55, 2 мая 2013 (UTC)[ответить]
Ну, жирные и курсивные не надо (правильно сделаны отдельные готические начертания), я имел в виду диакритики по типу (1E00...1EFF) Latin Extended Additional, и не все сочетания, а хотя бы употребляющиеся в языках (сейчас или раньше), они здесь уже описаны выше. --Jugydmort 21:38, 27 марта 2012 (UTC)
CYRILLIC LETTER GHE WITH HOOK
Ӻӻ, только без чёрточки посредине. Употребляется в языках Сибири: нивхском, эскимосском. В Юникоде рассматривается как вариант Ӷӷ, хотя в других подобных случаях буквы закодированы раздельно (қ/ӄ, ң/ӈ, ҳ/ӽ). См. Proposal to Encode Additional Cyrillic Characters (неопр.) (PDF) (2005).
✓ Особый знак для г фрикативного в русской транскрипции
Недавно я обнаружил, что в «Русском правописании» Грота для обозначение фрикативного (южного) h используется особый диакритический знак — крест над г. Может быть, я плохо искал, но мне кажется, что сейчас в Юникоде такого диакритического знака нет, не говоря уже о букве "ге с крестом". Изображение из книги прилагаю. Т. А. (обс./вклад) 09:12, 19 июня 2014 (UTC)[ответить]
Надпись с титульного листа книги, выпущенной в Южной Осетии в 1940: Хуссар Ирыстоны фолклор, последняя буква первой строчки дополнительный знак для /ы/ (на основе грузинской /и/ с выносом вниз)
Использовался грузинский алфавит с существующей в нём (но редко используемой) графемой для [ф] и двумя дополнительными символами для осетинских /æ/ (на основе грузинской /а/ с модифицированным выносом вверх) и /ы/.
Additional characters are emphasized.Дополнительный символ грузинского письма, использовавшийся для записи осетинской фонемы /æ/
GEORGIAN LETTER AEN
Что это? It looks like GEORGIAN LETTER AN with some kind of modification at the top, but it is not clear enough to see and we need more to encode. Evertype10:20, 21 декабря 2007 (UTC)[ответить]
Использовался для издания религиозной литературы, например требника И. Ялгузидзе в 1824 г. Названия я указал условные. Заглавные буквы в источниках я так и не нашел, но осмелюсь предположить, что так как в Хуцури в отличие от современного алфавита такое разделение было.--Untifler16:34, 23 сентября 2008 (UTC)[ответить]
Я где-то читал (в газете?), что в первых текстах грузиницей (у Ялгузидзе?) были просто сдвоенные грузинские буквы (не то „аа“ вместо „æ“, не то „а“ для \æ\ и две „аа“ для \а\). На репродукции это явно не так, есть отдельные символы. — Amikeco11:02, 25 сентября 2008 (UTC)[ответить]
Заявка на внесение абура в своё время уже подавалась, сейчас рассматривается. Как известно в 1920-е существовал у Коми особый алфавит, так называемый молодцовский. Его буквы в Юникод внесены.
Даже у армянского алфавита есть одна утерянная буква, использованная в 1921-29 годах, до перехода на латиницу. Буква напоминала m, что означала, честно говоря, не известно.--Untifler18:54, 9 апреля 2008 (UTC)[ответить]
Обновлённая татарская арабица 1920-х. В принципе, в 1920-е сущетвовали чеченские и др. экзотические арабицы...
Участник:Noorlan. Существовали буквы с дополнительными символами, у меня в коллекции сканов есть почти все тюркские неюникодовские буквы и ряд кавказских в том числе и чеченские, но чтобы их разместить нужно самому прорисовать шрифты или сделать рисунки. сделаю позже...
-
!!!!!! Noorlan, поделись пожалуйста сканами чеченских букв, и всем что есть по чеченскому и ингушскому языку на латинице rexxel@rambler.ru !!!!!
В Юникоде также не хватает двух очень нужных для Янга Имля символов - буквы "йа"-ى с запятой наверху, как у ۇ и короткой вертикальной черточки под строкой, обозначавшей "твердость" слова
Раздельный арабский/Separated Arabic
Боронгы болгарлар (Древние Булгары, The Ancient Bolgars) by G. Gaziz, Kazan, 1924. Раздельный арабский
Хотя, наверное, это в обоих случаях была просто разновидность шрифта? Ведь на том же листе можно увидеть напись сверху ("Пролетариии всех стран, объединяйтесь") слитным арабским...
Нет. В таджикском официально в конце 1920-х гг. вводился разделный арабский шрифт, но он оказался крайне неудобным для письма и вскоре был отменён. Geoalex06:04, 9 октября 2008 (UTC)[ответить]
Не знаю. Я про это читал в диссертации "История таджикской письменности". Фотокопий текстов на этом алфавите там не было. Как я понимаю, в таджикской версии использовались изолированные формы арабских букв. Geoalex07:21, 9 октября 2008 (UTC)[ответить]
Как я понял, в татарском языке оно использовалось параллельно со слитным арабским, для выделения каикх-либо заголовков и т.п. и виддимо в машинописи. Вообще, как мне кажется этот стиль нуждается в кодификации, хотя вопрос спорный. Ситуация напоминает грузинский мтаврули, который и не шрифт отдельный сам по себе, и не заглавные буквы. Может быть можно определить какие нибудь служебные символы, после которых арабские буквы идут раздельно, а грузинский текст становится мтаврули?--Untifler18:56, 19 декабря 2008 (UTC)[ответить]
Есть ещё такая интересная вещь, как белорусская арабица. Белорусские татары, которые ей пользовались, изобрели ещё две буквы для [ц] и [дз] - сад и даль с тремя точками внизу соотвественно. В Юникоде их, похоже, нету. С двумя точками снизу есть, а с тремя нет.
Наверное, это было бы не плохо.. Хотя мне кажется, эти названия уже существуют... Просто нужен специалист по типографскому делу. --Untifler11:31, 20 октября 2006 (UTC)[ответить]
In Unicode 5.2, letters of the Turkic alphabet, including national and historical varieties, are represented by the block: Turkic 10C00–10C4F --Proger23:23, 2 мая 2010 (UTC)[ответить]
С гагаузским интересно. Читал в одной книге статью по истории гагаузской письменности, так там вообще не упоминается, что для гагаузского языка использовался греческий алфавит. Кириллица в 19 веке была, латиница была во время румынской оккупаци Бессарабии, была кириллица СССР, современная латиница существует, а вот упоминания про греческий алфавит встречались только в интернете, но всегда без конкретных примеров. Может она использовалась за пределами Российской империи/СССР (там живут гагаузы?)? Geoalex13:14, 18 декабря 2006 (UTC)[ответить]
Гагаузы изначально жили на северо-востоке Болгарии и немного там остались и сейчас, но было б странно использовать там греческое письмо. Да и в Бессарабии тоже не с чего. Так что выглядит не очень правдоподобно. --Koryakov Yuri13:59, 18 декабря 2006 (UTC)[ответить]
Участник Noorlan. Гагаузы и урумы писали греческими буквами, но специфических букв кажется так практически небыло, окромя "σ" с двумя точками сверху, посмотрю подробнее, кажется в рукописях иногда использовались и русские буквы.
Кстати, древнегреческие диакритики, не имеющие аналогов в современном языке, в юникоде не имеют вариантов с нулевой шириной (combining greek dasia, к примеру, отсутствует). Считаю необходимым их ввести. Греческая политоническая раскладка — это хорошо, но комбайны были бы удобнее. --Усама ибн Саддам бен Ёрик13:56, 30 ноября 2009 (UTC)[ответить]
Комбинирующие псили и дасия в Юникоде есть, они совмещены с запятой сверху (U+0313 COMBINING COMMA ABOVE) и зеркальной запятой сверху (U+0314 COMBINING REVERSED COMMA ABOVE). — Monedula20:10, 30 ноября 2009 (UTC)[ответить]
Спасибо, именно их я и использую, но интересен вопрос: с чисто визуальной точки зрения они совершенно одинаковы, но по всей строгости использование «верхних запятых» не является ли суррогатом? --Усама ибн Саддам бен Ёрик18:22, 7 декабря 2009 (UTC)[ответить]
С удивлением для себя не обнаружил «отечественные» символы «меньше или равно» и «больше или равно» (). Они найдены только в пользовательской области кодов некоторых шрифтов. — Vovanium21:00, 25 января 2007 (UTC)[ответить]
Нового знака рубля официально пока нет, но, думаю, для академических и, в первую очередь, палеографических целей необходимо ввести символ старинного знака рубля (old russian rouble sign) в юникод. --Усама ибн Саддам бен Ёрик14:02, 30 ноября 2009 (UTC)[ответить]
Переписываюсь с автором заявки по Драму. В принципе, по рублю ситуация решаемая, но - требуются доказательства использования этого символа - сканы старых книг, и т.п. --Untifler08:35, 17 октября 2010 (UTC)[ответить]
Материала достаточно уже есть. И я, пожалуй бы, уже написал заявку в Юникод самостоятельно, но не владею на должном уровне английским, не могу нарисовать шрифтовой символ (а это обязательно нужно делать). --Kalashnov08:46, 17 октября 2010 (UTC)[ответить]
Там помимо простого написания заявки еще куча процедур, в которых я тоже до конца не разобрался, поэтому прибегаю к помощи Карла! Вышлите мне все сканы, что у вас есть, кроме того, современную интерпритацию этой лигатуры в хорошем разрешении, под шрифтовой символ. Адрес - мой_ник@yandex.ru, в понедельник я перешлю Карлу файлы и переведенные пояснения. Хотел уточнить, а этот символ был только в скорописи? Типографским способом он не печатался нигде? В принципе, для Юникода это не проблема, например кодируют буквы, которые наносились только зубилом по камню, просто интересно :) --Untifler09:06, 17 октября 2010 (UTC)[ответить]
Карл -- это Карен Комендарян? Ни одного печатного варианта символа неизвестно. Вероятнее всего, он использовался только на письме. Материалы вышлю с некторыми пояснениями в течение десяти минут --Kalashnov09:15, 17 октября 2010 (UTC)[ответить]
И кстати, три знака, которые приведены как иллюстрация к данному разделу были нарисованы по моей просьбе 10 лет назад Владимиром Ефимовым, арт-директором Паратайпа. Однако я думаю, что такое начертание ошибочно (жаль, что оно так культивируется). Символ застыл в своем развитии, будучи написанным суперскриптом (2). Думаю в таком виде его и нужно подавать в Юникод. --Kalashnov09:44, 17 октября 2010 (UTC)[ответить]
Напишите кто-нибудь заявку по этому символу, кто знает ихний язык. Ясное дело, что русский символ они в свой стандарт не включат, но хоть посмеёмся над тем, что ответят (если вообще обратят внимание на заявку из России). 17:30, 31 августа 2011 (UTC)
Предлагаю отправить заявку на включение в Юникод символа знака качества СССР. Его распространение и использование выходило за рамки сертификации, с учётом количества выпускаемых товаров в СССР он был распространён повсеместно, известен и до сих пор как символ отечественного производства. Было бы очень хорошо и удобно, если бы он был представлен в виде текстового символа. 14:57, 13 июня 2011 (UTC)
Кстати, видел и такое. В некоторых товарных номенклатурах встречалось. К сожалению, они врядли сохранились, так что надо поискать. Но суть даже не в этом. Его использование носит примерно такой же характер, как использование символов православного креста, серпа и молота и т.п. (см., например, таблицу 2600-26FF). 10:10, 19 июня 2011 (UTC)
Они, вроде бы туда попали по той же причине. Поищите пожалуйста эти примеры, возможно даже это старая советская упаковка, и если не трудно - загрузите сюда. --Untifler12:31, 19 июня 2011 (UTC)[ответить]
Ну вот, например, первое, что попалось под руку - упаковка от чайных ложек: [12] (на самих ложках тоже знак стоит). 13:11, 20 июня 2011 (UTC)
Не очень очевидный дизайн, к сожалению. Лично помню, что были упаковки, на которых знак качества стоял не особняком, а практически на одной линии и почти одного размера со шрифтом текста. А иначе, не очень очевидно, что это типографский знак, а не уникальная логотип-картинка.--Untifler16:26, 20 июня 2011 (UTC)[ответить]
К сожалению, пока не смог найти у себя такого знака, хотя варианты встречал самые разные, даже в виде печати на этикетке. Надо ещё посмотреть в Интернете. Хотя, с другой стороны, в Юникоде имеются целые пачки значков, употребляющихся точно так же, как знак качества, например, маркировка упаковок, опасных грузов и т.п. Кроме того, там есть кучи символов, вообще не употребляющихся как элементы текста (например, таблица 1F300). Врядли составители Юникода слишком усердно искали такие примеры при их добавлении. 11:38, 22 июня 2011 (UTC)
We'll NEVER add Soviet quality mark! So you'll have to make your own font, where it should be somewhere in the middle of Supplementary Private Use Area-A. 91.77.70.11019:43, 30 августа 2011 (UTC)☭[ответить]
Чем объясняется такая категоричность? Уж не русофобией ли? Вы боитесь этого символа? Тогда зачем разместили в своём стандарте православный крест и серп и молот? Они вас должны пугать ещё сильнее, чем наш знак качества. 17:27, 31 августа 2011 (UTC)
No, it's not because of that! But we'll not add quality mark even in Unicode version 10.0! There are no available codepoints in Private Use Area (E000-F8FF) for that! So the only way to have such a symbol is to put it somewhere in Plane 15!! 91.77.83.10514:24, 1 сентября 2011 (UTC)☭[ответить]
Не из-за этого? А тогда из-за чего, уважаемый? Вы так яростно отвергаете всякую возможность его включения в ваш стандарт, при этом даже не потрудившись указать, почему (а ведь в уникод «Unicode» включено уже немало символов, имеющих на это намного меньше оснований, нежели наш знак качества), что у нас возникает такое предчувствие, что единственно верным решением тут будет создание нового стандарта ГОСТ на многобайтовую кодировку вместо вашего. 17:41, 1 сентября 2011 (UTC)
But no one will fumble through the Unicode to find quality mark in Plane 16. E000-F8FF is complete. So we have to put it in Plane 15. If we'll have a proposal to add it, we'll put it at codepoint U+Fxxxx. 91.77.83.10518:06, 1 сентября 2011 (UTC)☭[ответить]
Если не понимаете, что я пишу, воспользуйтесь автоматическим переводчиком, например, этим. Повторю ещё раз. «Зоны частного использования» пусть люди используют в личных нуждах. Здесь же речь идёт о реально существующем и массово используемом символе, и ни по каким параметрам «частным символом» его назвать невозможно. И это при том, что в ваш стандарт включено значительное количество символов, гораздо менее ценных (то есть имеющих гораздо меньше оснований на включение в стандарт), чем знак качества! Таким образом, я хочу понять, на каком основании вы пытаетесь отвергнуть саму возможность его включения в ваш стандарт этим своим сообщением: «We'll NEVER add Soviet quality mark!»? Если что-то не поняли, лучше переспросите, попробую написать по-английски. 12:59, 2 сентября 2011 (UTC)
We changed our mind! We'll add Soviet quality mark in Unicode v. 6.1 or maybe even later! ☭
Это очень хорошо, ждём с нетерпением. 09:06, 11 сентября 2011 (UTC)
Порылся в макулатуре, нашёл кусок какой-то древней накладной со знаками качества: [13]. Качество поганое, конечно, но сами знаки можно разглядеть. Главное - используются вполне себе как символы текста, а не эмблемы. 14:47, 15 октября 2011 (UTC)
Вам не составит труда сделать ОЧЕНЬ ЧЕТКИЙ скан данной накладной. Ну и если таких будет несколько разных, то тогда вопрос можно будет считать совсем решенным, заявку составить труда не составит. --Untifler17:06, 16 октября 2011 (UTC)[ответить]
Товарищи, в чём проблема? :) [14][15] А вот примеры использования знаков качества на советских товарах: [16][17][18] А тут - скан бирки калькулятора в довольно высоком разрешении. [19]
Вот к сожалению, все это не встречается в документах. Т.е не нанесено типографским способом. В идеале бы - пример документа как в примере выше, еще лучше - какой-нибудь советский текст, с включениями знака качества прямо в строку. только бы чтобы очень четко было. --Untifler18:26, 18 декабря 2011 (UTC)[ответить]
Открыл ссылку. Как думаете, что выдал Яндекс по этому запросу? 10 из 32 картинок - знак качества СССР в том или ином виде, остальное - что попало, из этого знак "РСТ" - 3 картинки. Думаю, хороший повод задуматься о необходимости этого символа в печатном виде. 17:43, 10 июля 2013 (UTC)
О кратке и бревисе
Известно то, что в кириллице и латинице форма бревиса несколько различается, но в Юникоде они объединены. Я обнаружил случай (русско-ненецкий словарь) одновременного использования кириллической и латинской форм в одном тексте (над кириллическими буквами), где и с краткой означает обычный Й, а и с бревисом — краткое произношение гласной и. --Jugydmort17:27, 9 января 2014 (UTC)[ответить]
Алфавит это не различает, и смысл бревиса определяется по контексту (латинский бревис бывает только после буквы ʼʼ - которой,как и ʼ, кстати, в Юникоде нет). Но если очень хочется видеть разницу, то последовательность символов "и + CGJ + U+0306 COMBINING BREVE" должна не позволить рендереру заменить "и + U+0306" на каноническую композицию (й) и вместо этого заставить пользоваться латинским бревисом при отображении. --Leob18:39, 2 июля 2014 (UTC)[ответить]
Буквы ʼʼ и ʼ в Юникоде есть. Это - 02BC MODIFIER LETTER APOSTROPHE и 02EE MODIFIER LETTER DOUBLE APOSTROPHE, у последнего даже в примечании указано Nenets. Латинский бревис бывает только после буквы ʼʼ - вообще насчёт этого точно не знаю, возможно есть и другие случаи. В принципе можно, наверно и так, как Вы предлагаете, но в идеале хотелось бы различать оба варианта. --Jugydmort20:18, 11 июля 2014 (UTC)[ответить]
Мне кажется, что их нужно добавить в Юникод. Так же нужно добавить туда запись Ибн ан-Надима. Вот названия приведенных в ней символов: CYRILLIC LETTER IBN AL-NADIM 1, CYRILLIC LETTER IBN AL-NADIM 2, CYRILLIC LETTER IBN AL-NADIM 3, CYRILLIC LETTER IBN AL-NADIM 4, CYRILLIC LETTER IBN AL-NADIM 5, CYRILLIC LETTER IBN AL-NADIM 6
С уважением, шкиипер17:54, 30 января 2014 (UTC).[ответить]