Кириллица с диакритикой

Автор Bahupada, 16:40 08 апреля 2012

« назад - далее »

Bahupada

Добрый день!
Кто-нибудь знает, есть ли в бездне юникодовых таблиц символов что-нибудь вроде кириллических букв с диакритикой, которые подошли бы для передачи фонетики санскрита и пали?

Ассаджи

#1
Доброго времени!

Латиница с диакритикой есть в стандарте Уникод http://www.unicode.org/charts/ , в разделе Latin Extended Additional.
Из кириллицы с диакритикой там только "и" да "у" долгие.

Есть отдельные кришнаитские шрифты:

Amita_Times_Cyr
Gokula
Krishna_Arial_Cyr

http://hayavadana.narod.ru/vaikharI/fonts2.rar
http://www.rupanuga.narod.ru/fonts/index.htm

Bahupada

#2
Немного выручает возможность набирать юникодовые объединенные диакритические знаки U0300 - U036F.

Тогда получается, к примеру, что-то вроде этого (для отображения необходим юникод):

ахим̣са̄
Аш́ока
Дан̣д̣ӣ
Говиш̣а̄н̣а
Ка̄лӣда̄са
Марка̄н̣д̣ейапура̄н̣а
пражн̃а̄
Йажн̃авалкйа


К сожалению, не всегда при наборе в кириллице диакритические знаки отображаются точно в нужном месте. В данном случае у меня долгая черта над буквами съезжает вправо, хотя в Word и других программах выглядит нормально.

Тоже самое шрифтом Arial:
ахим̣са̄
Аш́ока
Дан̣д̣ӣ
Говиш̣а̄н̣а
Ка̄лӣда̄са
Марка̄н̣д̣ейапура̄н̣а
пражн̃а̄
Йажн̃авалкйа


Тоже самое шрифтом Times New Roman:
ахим̣са̄
Аш́ока
Дан̣д̣ӣ
Говиш̣а̄н̣а
Ка̄лӣда̄са
Марка̄н̣д̣ейапура̄н̣а
пражн̃а̄
Йажн̃авалкйа


Тоже самое шрифтом Verdana (похоже, это шрифт по умолчанию):
ахим̣са̄
Аш́ока
Дан̣д̣ӣ
Говиш̣а̄н̣а
Ка̄лӣда̄са
Марка̄н̣д̣ейапура̄н̣а
пражн̃а̄
Йажн̃авалкйа


Мне кажется есть определенный смысл в том, чтобы при заимствовании в русском тексте палийского слова сохранять в нем особенности произношения. Человек незаинтересованный просто не будет обращать на это внимание, а те, кому интересно капнуть глубже, будут гораздо ближе к исходным терминам, чем тогда, когда особенности произношения полностью стираются на письме.

Сергей О.

В тексте шрифтом Arial и  Times New Roman не сползают знаки у меня в браузере. А как тильды пририсовывать к кирил. буквам, кто-нибудь знает, умеет?

Сергей О.

А подскажите пожалуйста, как вставить символ с определенным кодом в сообщение здесь на форуме. Например A5; - может это заменит n с тильдой?

Bahupada

#5
Добавил в примеры выше слова с тильдой (U0303): пражн̃а̄, Йажн̃авалкйа

У меня тоже в шрифтах Arial и Times New Roman отображается нормально. Это со шрифтом Verdana, который включен по умолчанию, некоторые сложности.

Bahupada

Я набираю в MS Word.
Там можно вызвать окошко вставки символов и в таблице символов прокрутить к разделы "Объединенные диакритические знаки", где для каждого символа отражается код.

Если выписать все коды отдельно, то можно просто после буквы набрать цифрами номер символа, скажем 0303 для тильды, и нажать Alt+x. Тогда к символу, который стоит перед цифрами, добавляется соответствующий диакритический знак.

Можно также написать или найти готовый макрос для Openoffice.

Может ли что-то заменить "н" с тильдой? )

Вот "р" с точкой внизу действительно можно заменить на что-то другое, иначе точка может слиться с палочкой:
(шрифт Times New Roman): смр̣ти
(шрифт Verdana): смр̣ти

Поэтому можно набирать, скажем, с тильдой:
(шрифт Times New Roman): смр̃ти
(шрифт Verdana): смр̃ти

Сергей О.

ЦитироватьЯ набираю в MS Word.
Спасибо, в LibreOffice получилось.

Понятно, я просто сразу не нашел н с тильдой (а, оказывается тильда к любой букве добавляется) и наткнулся на вот такую букву Ҥ. Вот еще хорошая буковка Ӈ. Но наверное тильда привычнее, есть ѧнѧлогия, пѧрѧллель с лѧтиницей.

Bahupada

#8
В общем, если подытожить, то для отражения палийских звуков кириллицей можно пользоваться юникодовыми объединенными диакритическими знаками, то есть специальными символами юникод, которые объединяются с другими буквами:







значениевидКодПример
долгота гласной◌̄U0304а̄, ӯ, ӣ
точка над буквой◌̇U0307н̇
тильда над буквой◌̃U0303н̃
точка под буквой◌̣U0323т̣, д̣, н̣

Bahupada

Обнаружился более простой, чем с использованием MS Word, способ набора юникодовых символов в Windows.

Для этого нужно, чтобы в реестре имелось соответствующее значение с типом "REG_SZ" по адресу:
HKEY_Current_User/Control Panel/Input Method

Нужно здесь создать ключ с именем EnableHexNumpad и поставить значение 1 (с типом REG_SZ).
Теперь после перезагрузки компьютера можно вводить юникодовые символы с помощью кнопки Alt:

Надо зажать и удерживать кнопку Alt, после чего нажать кнопку "+" (не удерживая) и потом ввести шестнадцатеричное значение символа.
Секрет ввода: <Alt> + <+> + <xxxx>

Соответственно, то же самое работает с диакритикой: набираем "н", потом зажимаем Alt, потом "+", потом набираем "0303", и получаем букву н̃.


http://www.fileformat.info/tip/microsoft/enter_unicode.htm


Bahupada

В общем, пожалуй, основной целью темы является не столько научиться технически набирать диакритику в кириллице, сколько попытаться осознать необходимость этого или отсутствие такой необходимости. Так что было бы интересно услышать разные мнения.
Если сойдемся на нужности, можно принять тот или иной подход в рамках дальнейших работ Содружества.

Ассаджи

Я давно обсуждал этот вопрос с Владимиром Карпинским.

На данный момент, считаю, что кириллица с диакритикой не нужна.

Международный алфавит http://en.wikipedia.org/wiki/International_Alphabet_of_Sanskrit_Transliteration
общепринят, удобен и включен в Уникод.

Оригинальных русских изданий палийских текстов нет, и не предвидится.

Возникают вопросы, например, передачи "дж" (двумя буквами или одной "ж"), которые требуют коллективной договоренности сложившегося сообщества.

Возможно, в будущем...

Bahupada

Хорошо бы было тогда хотя бы договориться о транслитерации на русский, чтобы не было разброда и шатаний - не только слов из пали, но и санскритских слов.

Скажем, как лучше передавать различие между санскритским श (ś)  и ष (ṣ)? Просто как "щ" и "ш"?

Верно ли транслитирировать имя славного индийского раджи как Ашока, вместо Ащока, если записывать его непалийский вариант (Асока)?

Если исходные звуки русскоговорящему человеку трудно различить при произношении то можно так и условиться, чтобы передавать их оба всегда ка "ш"?

В общем, предлагаю сделать таблицу транслитерации именно для русских текстов, ведь в русском языке названия индийских городов, имена и т.д. приходится изменять по падежам и т.д., и подставлять на их место международное несклоняемое написание было бы неудобно для чтения и нелогично для языка.

Bahupada

#14
Оказывается, все уже придумано до нас.

Статья в Википедии Индийско-русская практическая транскрипция

ЦитироватьВ последнее время стали доступны написания как в национальной графике, так и в более точной транслитерации (системы типа IAST или ISO 15919), однако это фактически не влияет на русскую практическую транскрипцию, так как разница между церебральными (ретрофлексными) и дентальными согласными, не различавшимися в системе RGS-II, всё равно не может быть отражена в русской графике. Согласные ś [श] и ṣ [ष] в целом близки в произношении к русским [щ] и [ш], однако по традиции буква «щ» в иноязычных названиях не используется (кроме как при заимствовании из польского и украинского) и обе фонемы передаются на русский с помощью «ш».

Интересно так же:

ЦитироватьСочетания y с последующей гласной передаются следующим образом:





СочетаниеВ начале слова и после гласнойПосле согласной внутри морфемыПосле согласной на стыке корней
ya/yāяьяъя
yyaйя--
yo/yōйоьойо
и т.д.

удвоенные согласные передаются в русской транскрипции также удвоенными, то есть bb как бб, chch — чч, cch — ччх, dd — дд, jj — ддж: Ujjain — Удджайн.

В качестве источника для материала указаны полувековые работы:

- Инструкция по передаче на картах географических названий Индии, Пакистана и Цейлона / Сост. И. В. Попов; Отв. ред. С. А. Тюрин. М.: РИО ВТС, 1953. 27 с.
- Инструкция по передаче на картах географических названий с хинди / Сост. и ред. В. И. Бабушкина. М.: ЦНИИГАиК, 1959. 66 с.

Видимо с тех пор ничего не поменялось.

Ассаджи

#15
Еще одно преимущество алфавита IAST в том, что он позволяет передавать фонетическую точную (lossless) транскрипцию.

"Индийско-русская практическая транскрипция" передает транскрипцию с заметными потерями. По ней трудно восстановить исходное слово, и разные слова могут транскрибироваться одинаково.

Примеры более точной транскрипции на основе кириллицы:

http://gopal.ru/Translation/Sanskrit/acyutaashtaka.htm
http://gopal.ru/Program/fonts.htm

http://www.rupanuga.narod.ru/fonts/index.htm

http://abc.hindischool.info/html/abc1_10.html

Bahupada

Цитата: Ассаджи от 08:06 10 апреля 2012
Еще одно преоимущество алфавита IAST в том, что он позволяет передавать фонетическую точную (lossless) транскрипцию.
При этом не очень понятно, как изменять такие слова по правилам русского языка в тексте? Всегда все сводить к именительному и писать в транскрипции IAST?

Цитировать"Индийско-русская практическая транскрипция" передает транскрипцию с заметными потерями. По ней трудно восстановить исходное слово, и разные слова могут транскрибироваться одинаково.
Ну так ведь мы отказываясь от кириллицы с диакритикой как раз и допускаем возможность потерь и неточностей, которые тем не менее можно восстанавливать в виде примечаний или в скобках.

ЦитироватьПримеры более точной транскрипции на основе кириллицы:
http://gopal.ru/Translation/Sanskrit/acyutaashtaka.htm
http://gopal.ru/Program/fonts.htm
http://www.rupanuga.narod.ru/fonts/index.htm
http://abc.hindischool.info/html/abc1_10.html
Как я понял, это как раз то, от чего мы решили отказаться - кириллические шрифты с диакритикой.

Ассаджи

Тут на самом деле два с половиной вопроса:
1) передача палийских текстов кириллицей;
2) передача палийских названий, терминов и имен а) в примечаниях и скобках б) в самом переводе.

Для передачи текстов система не разработана. Но было бы хорошо наметить такую систему.

В примечаниях и скобках, на мой взгляд, лучше пользоваться алфавитом IAST как более точным и позволяющим добраться до оригинального слова.

Для передачи названий и имен, например "Мадджхима", подходит "Индийско-русская практическая транскрипция".

ЦитироватьСкажем, как лучше передавать различие между санскритским श (ś)  и ष (ṣ)? Просто как "щ" и "ш"?

Да. Если и то, и другое, передавать как "ш", то теряется различие.

ЦитироватьВерно ли транслитирировать имя славного индийского раджи как Ашока, вместо Ащока, если записывать его непалийский вариант (Асока)?

Его звали Асока, санскрита тогда еще не было:

http://dhamma.ru/forum/index.php?topic=663.0

"Ашока" - это санкритизация, ставшая традиционной в Индии, и перенесенная оттуда в русские тексты.

Сергей О.

Bahupada, вы не могли бы подправить сообщение 8 (чтобы им можно было пользваться как справкой)? Там кажется опечатка, один код 0307 указан у разных символов.

Что касается нужды в использовании кириллицы с диакритикой, вот какие-то соображения: когда в русском тексте приводишь слово (понятие) на пали, латиница на мой взгляд выглядит косвенной отсылкой на Запад (в некотором смысле и прямой отсылкой, т.к. во многом мы знакомимся с палийскими текстами и Тхеравадой вообще благодаря европейским ученым, и монахам - американцам, немцам и т.д.) Но на мой взгляд эта отсылка, как и вообще вставка слова на латинице в текст на кириллице, вовсе не обязательна, мы ведь пишем не о европейской/американской культуре или религии, а (если говорить о древних текстах) о древнеиндийской и соседних. Пишем на кириллице, поэтому естественно передавать звучание индийских слов на кириллице же. Я например часто пишу палийские слова на кириллице на форумах (сання, ведана, танха, винняна и т.д.), впрочем также и на латинице, когда как. Мне кажется естественным, что для более точной передачи звучания можно использовать диакритические знаки.

Что касается больших цитат и целых текстов, тут наверное играет роль то, что канон и другая литература доступны в записи на латинице (есть конечно на тайском и др., но эти письменности знакомы наверное все же гораздо меньшему числу русскоговорящих (или, шире, тех, кто использует кириллицу для записи речи), чем латиница). Действительно, и поиск проще делать, и скопировать из сутты отрывок, не преобразуя его, проще, так что тут мне кажется использование кириллицы менее удобным и выгодным.

Bahupada

Цитата: Сергей О. от 12:23 10 апреля 2012
Bahupada, вы не могли бы подправить сообщение 8 (чтобы им можно было пользваться как справкой)? Там кажется опечатка, один код 0307 указан у разных символов.
Спасибо, исправил!