之前做一个诗词相关的网站时,本预想添加拼音,数据来源为hanlp或google翻译,但一直拖着没做。最近看到html对注音的支持,包括和标签,便写个demo看看效果。
数据来源使用google翻译,发现有些排版问题,有些拼音会进行分词并连接在一块,就算在汉字中间添加空格也不行,于是网上找找拼音拆分的算法,基本上都是根据声母和韵母回溯判断,例如:拼音拆分算法,我自己尝试用正则表达式直接拆分,发现效果不错。
See the Pen 拼音拆分 by snowtraces (@snowtraces) on CodePen.