校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > Python實現拼音轉換

Python實現拼音轉換

熱門標簽:騰訊地圖標注沒法顯示 打電話機器人營銷 南陽打電話機器人 ai電銷機器人的優勢 商家地圖標注海報 地圖標注自己和別人標注區別 聊城語音外呼系統 孝感營銷電話機器人效果怎么樣 海外網吧地圖標注注冊

什么是拼音轉換

在我們學習語言之前,我們一般會學習拼音來認識漢字,并學會如何讀漢字。所以,拼音在對于我們語言的重要性不言而喻。

而拼音轉換指的是將漢字轉為拼音的過程。但是,我們中文博大精深,一般來說某個字并不僅僅只有一個讀音,比如“翟”,它作為姓氏可以讀作zhái,作為其他可讀作di。這是就需要結合上下文,或者說結合與其組合的詞匯進行轉換拼音。不僅如此,拼音還有音調,比如一二三四聲表示的意義有時候也是不一樣的。

本篇博文將介紹字符串到拼音的轉換。

拼音轉換

首先,HanLP庫提供的拼音轉換為本位于data/dictionary/pinyin/pinyin.txt文件中。每行分別由=隔開漢字與拼音。其中多音字的拼音數量多余漢字數量。在實際的轉換過程中,默認讀取多音字的第一個拼音,除非匹配到更長的詞語。

此外,HanLP庫還支持聲母,韻母,音調,音標以及輸入法首字母與收聲母功能。當然,也能給前文的繁體字轉換為拼音。

下面,我們來看一段代碼示例:

if __name__ == "__main__":
    text = "重載不是重量"
    pinyin_list = HanLP.convertToPinyinList(text)
    print(pinyin_list)

運行之后,控制臺輸出如下:


可以看到,基本上每個字的拼音都輸出了。如果程序判斷不出來多音字是哪個聲調,會輸出其所有的聲調。比如這里的體輸出了3聲和1聲,重輸出了3聲與2聲。

在python中,我們通過HanLP.convertToPinyinList進行漢字與拼音的轉換。

輸出音調

鑒于我們已經知道了如何轉換漢字到拼音,那么我們現在需要實現的是單獨獲取每個漢字的音調,不需要聲調。現在該如何去實現呢?不妨先來看看代碼:

if __name__ == "__main__":
    Pinyin = JClass("com.hankcs.hanlp.dictionary.py.Pinyin")
    text = "重載不是體重"
    pinyin_list = HanLP.convertToPinyinList(text)
    print(pinyin_list)
    print("輸出音調")
    for pinyin in pinyin_list:
        print("%s," % pinyin.getPinyinWithToneMark(), end=" ")

如上面代碼所示,我們獲取了Java的HanLP庫中的Pinyin類,這個類可以幫我們處理很多的拼音相關的問題,比如這里的獲取音調。

運行之后,效果如下:

需要注意的是,前面博文已經說過了,通過python進行HanLP庫使用時,盡量調用Java類進行處理,因為Java類的處理時間比python快很多。這里我們通過Pinyin類的getPinyinWithToneMark()方法獲取聲調。

輸出聲調

既然可以只輸出音調,那么肯定也可以單獨輸出聲調。具體代碼如下:

if __name__ == "__main__":
    Pinyin = JClass("com.hankcs.hanlp.dictionary.py.Pinyin")
    text = "重載不是體重"
    pinyin_list = HanLP.convertToPinyinList(text)
    print(pinyin_list)
    print("輸出聲調")
    for pinyin in pinyin_list:
        print("%s," % pinyin.getTone(), end=" ")

運行之后,效果如下:

這里我們通過Pinyin類的getTone()方法獲取聲調。

輸出聲母

同樣的,我們還可以輸出聲母。代碼如下:

if __name__ == "__main__":
    Pinyin = JClass("com.hankcs.hanlp.dictionary.py.Pinyin")
    text = "重載不是體重"
    pinyin_list = HanLP.convertToPinyinList(text)
    print(pinyin_list)
    print("\r\n輸出聲母")
    for pinyin in pinyin_list:
        print("%s," % pinyin.getShengmu(), end=" ")

運行之后,效果如下:

這里我們用getShengmu()方法輸出聲母,方法名就是中文意思,很好理解。

輸出韻母

接著,我們再來輸出韻母。代碼如下:

if __name__ == "__main__":
    Pinyin = JClass("com.hankcs.hanlp.dictionary.py.Pinyin")
    text = "重載不是體重"
    pinyin_list = HanLP.convertToPinyinList(text)
    print(pinyin_list)
    print("\r\n輸出韻母")
    for pinyin in pinyin_list:
        print("%s," % pinyin.getYunmu(), end=" ")

運行之后,效果如下:

這里我們用getYunmu()方法輸出韻母,方法名就是中文意思,很好理解。

處理數字拼音

除此之外,上面因為都是漢字,所以大家肯定都很好處理成拼音。但是現在很多時候,中文文本里面并不僅僅只有漢字,也有數字和英文。但是拼音是漢字獨有的,那怎么辦呢?

我們先來看看按上面直接處理帶數字與英文時,效果怎么樣。代碼如下所示:

if __name__ == "__main__":
    Pinyin = JClass("com.hankcs.hanlp.dictionary.py.Pinyin")
    text = "我們到2035年就會稱為世界第一"
    pinyin_list = HanLP.convertToPinyinList(text)
    print(pinyin_list)

運行之后,效果如下:


可以看到數字都直接替換為none5,也就是缺失的意義。拼音文件找不到與其匹配的漢語拼音。

而我們實際在處理中文文檔時,都是保留數字與英文的并不直接翻譯。其實這里我們想保留其數字的話,HanLP.convertToPinyinString()方法就能實現,我們來看看這個方法的完整定義:

convertToPinyinString(轉換為拼音的字符串文本,輸出間隔符,布爾類型)

相信看了上面方法的讀者應該很快就知道了,第3個布爾類型就是轉換數字與保留數字的關鍵參數,這里我們再來變換代碼:

if __name__ == "__main__":
    Pinyin = JClass("com.hankcs.hanlp.dictionary.py.Pinyin")
    text = "我們到2035年就會稱為世界第一"
    pinyin_list = HanLP.convertToPinyinString(text," ",False)
    print(pinyin_list)

運行之后,我們的英文與數字就會原封不動的保留下來。效果如下:

到此這篇關于Python實現拼音轉換的文章就介紹到這了,更多相關Python 拼音轉換內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python 中拼音庫 PyPinyin 用法詳解
  • python 批量將中文名轉換為拼音
  • 基于Python第三方插件實現西游記章節標注漢語拼音的方法
  • 利用python實現漢字轉拼音的2種方法
  • 用Python從0開始實現一個中文拼音輸入法的思路詳解
  • Python3實現漢語轉換為漢語拼音
  • python去除拼音聲調字母,替換為字母的方法
  • Python 獲取中文字拼音首個字母的方法
  • python獲取一組漢字拼音首字母的方法
  • Python 返回漢字的漢語拼音

標簽:聊城 六盤水 撫州 楊凌 牡丹江 迪慶 揚州 南寧

巨人網絡通訊聲明:本文標題《Python實現拼音轉換》,本文關鍵詞  Python,實現,拼音,轉換,Python,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python實現拼音轉換》相關的同類信息!
  • 本頁收集關于Python實現拼音轉換的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 二连浩特市| 哈尔滨市| 牟定县| 瓮安县| 银川市| 太和县| 从化市| 东安县| 中江县| 沧州市| 莱芜市| 岢岚县| 汉源县| 时尚| 佛教| 宁武县| 隆化县| 南部县| 吴堡县| 宁陕县| 天镇县| 偏关县| 霍林郭勒市| 赣州市| 常山县| 东阿县| 西华县| 乌兰浩特市| 三亚市| 舟山市| 化州市| 普格县| 繁峙县| 平顶山市| 任丘市| 佛山市| 肃宁县| 阜康市| 晋州市| 金坛市| 卢湾区|