Выполняет преобразование китайских иероглифов в пиньин. Можно использовать для фонетики китайских иероглифов, сортировки, просмотра информации.
Основано на hotoo/pinyin проекте.
- Documentation: http://pypinyin.rtfd.io/
- GitHub: https://github.com/mozillazg/python-pinyin
- License: MIT license
- PyPI: https://pypi.python.org/pypi/pypinyin
- Python version: 2.6, 2.7, pypy, 3.3, 3.4, 3.5, 3.6
- Весьма точная транскрипция, основанная на интеллектуальном сопоставлении словосочетаний
- Поддержка иероглифов в несколькими вариантами произношения
- Поддержка простой и полной формы иероглифов, фонетическая поддержка
- Поддержка различных форм пиньина/фонетических стилей
$ pip install pypinyin
Подробную документацию смотрите здесь:http://pypinyin.rtfd.io/
Python 3(в Python 2 строку '中心'
достаточно заменить на u'中心'
):
>>> from pypinyin import pinyin, lazy_pinyin
>>> import pypinyin
>>> pinyin('中心')
[['zhōng'], ['xīn']]
>>> pinyin('中心', heteronym=True) # Задействовать режим выдачи иероглифов с несколькими вариантами произношения (омографы)
[['zhōng', 'zhòng'], ['xīn']]
>>> pinyin('中心', style=pypinyin.FIRST_LETTER) # Настройка фонетического стиля
[['z'], ['x']]
>>> pinyin('中心', style=pypinyin.TONE2, heteronym=True)
[['zho1ng', 'zho4ng'], ['xi1n']]
>>> pinyin('中心', style=pypinyin.BOPOMOFO) # Фонетический стиль - чжуи́нь или бопомофо
[['ㄓㄨㄥ'], ['ㄒㄧㄣ']]
>>> pinyin('中心', style=pypinyin.CYRILLIC) # Фонетический стиль - запись кириллицей по системе Палладия
[['чжун1'], ['синь1']]
>>> lazy_pinyin('中心') # Без учета омографов
['zhong', 'xin']
Через командную строку:
$ pypinyin 音乐
yīn yuè
$ pypinyin -h
Стиль инициалей (INITIALS) следующих “雨”、“我”、“圆” и других иероглифов возвращает символ пустой строки, так как согласно "Метод фонетической транскрипции китайских иероглифов" , символы y, w, ü (yu) не являются инициалями, при этом к некоторым специальным гласным без согласных букв,добавляется y или w,а также ü согласно специальным правилам —— @hotoo
Если вы заметили, что это приносит вам трудности, то пожалуйста повнимательней отнеситесь к некоторым иероглифам без инициалей (например “啊”、“饿”、“按”、“昂” и т.д.). Тогда вам возможно потребуется стиль выдачи инициалей (FIRST_LETTER). —— @hotoo
Для справки: hotoo/pinyin#57, #22, #27, #44
- hotoo/pinyin: Утилита для пиньин конвертации китайских иероглифов Node.js/JavaScript версия.
- mozillazg/go-pinyin: Утилита для пиньин конвертации китайских иероглифов Go версия.
- mozillazg/rust-pinyin: Утилита для пиньин конвертации китайских иероглифов Rust версия.
- wolfgitpr/cpp-pinyin: Утилита для пиньин конвертации китайских иероглифов Cpp версия.
- wolfgitpr/csharp-pinyin: Утилита для пиньин конвертации китайских иероглифов C# версия.