2024年6月5日发(作者:)
(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(21)申请号 CN2.4
(22)申请日 2005.06.15
(71)申请人 李丹
地址 100009 北京市东城区交道口西公街22号
(72)发明人 李丹
(74)专利代理机构
代理人
(51)
G06F3/023
权利要求说明书 说明书 幅图
(10)申请公布号 CN 1687885 A
(43)申请公布日 2005.10.26
(54)发明名称
三一代码汉语计算机语音输入法
(57)摘要
本发明是在一种三一代码汉语计算
机输入法技术上的升级,在输入汉语字符
的同时输入语音,达到每两键输入两个字
符就可同时输入一个语音,连续拼输就从
语词、语句到普通话的输入;为启蒙学汉
语,为方言地区推广普通话、为外国人学
汉语,走上电子化简易化的教学之路,把
世界上公认最难学的汉语变成易学的语
言。
法律状态
法律状态公告日
法律状态信息
法律状态
权 利 要 求 说 明 书
1、一种三一代码汉语计算机语音输入法,其特征在于由一个三一代码信息语音的
阶梯工程的汉语拼音系统工程的设计,取得汉语语音技术的全部材料;26个声母
的排序;汉语60音素;884音节;3536个调节;从而完成四调的语音库和同步输
入法,完成汉语和语音的同输法。
2、一种三一代码汉语计算机语音输入法,其特征在于同步输入的标音的双发音法、
无符大写标调法和汉语标符法。
3、一种三一代码汉语计算机语音输入法,其特征在于每敲两键输入两个字母,表
达一个音节,同时输入语音的一个调节,连续构成语词、语句和普通话。
说 明 书
技术领域
本发明涉及计算机语言、语音和汉语拼音的交叉学科。
背景技术
在已开发的“一种三一代码汉语计算机输入法”(专利号96 100728-1)的基础上,为进
一步对汉语输入计算机技术的升级,实现在汉语输入的同时,开发出汉语语音的输
入法。目前计算机输入的语言都是用输入字符来表达的。它只能通过视觉的阅读来
理解,而不能象人的语言通过听觉来接收,是计算机语言和人类语言存在的差异。
发明内容
本发明的任务;提供一种三一代码汉语计算机语音输入法,在用字符输入表达汉语
(三一代码)的同时,还可输入语音用听觉来接收,取得计算机的汉语(字符)和语音
双输的创新。三一代码(简称汉码)在输入计算机汉语的同时,要达到语音输入的条
件,必须创建汉语音调库。但是我国的语言尚未拼音化,就没有条件提供开发此项
信息语音技术的数据!当前是等待我国实现拼音化之后再来开发信息技术呢?还是
响应号召开展“交叉学科”的研究;把汉语拼音学科作为实现信息学科的一项“阶梯
工程”来研发?这属于没有条件创造条件也要上的开发路线,无疑后者是符合加速
振兴中华的战略。
本发明的技术方案是:
1、一种三一代码汉语计算机语音输入法,其特征在于由一个三一代码信息语音的
阶梯
工程的汉语拼音系统工程的设计,取得汉语语音技术的全部材料;26个声母的排
序;汉语60音素;884音节;3536个调节;从而完成四调的语音库和同步输入法,
完成汉语和语音的同输法。
2、一种三一代码汉语计算机语音输入法,其特征在于同步输入的标音的双发音法、
无符大写标调法和汉语标符法。
3、一种三一代码汉语计算机语音输入法,其特征在于每敲两键输入两个字母,表
达一个音节,同时输入语音的一个调节,连续构成语词、语句和普通话。
一,系统性开发阶梯工程:汉语是一种以调为主体的四调语言,在语音输入上是要
创建四调的语调库;语调库的数据是出自完整的汉语拼音系统工程,做为信息语音
的前提;要实现语音输入必须把它作为信息语音技术“阶梯工程”而设计。要从表达
音素的符号设计、符号的排序、符号的标音、符号音素的划分;声、韵字母数额的
标定、声韵音素的计算,才能取得汉语实际音节的数据和音调的数据,构成语调库
的数据条件。
二,阶梯工程的设计:是以现行“汉语拼音方案”(简称“汉拼”)为基础,通过以下的
程序,把“汉语拼音学科”系统化;取得语调库的各项数据,完成信息技术的阶梯工
程,从而使我国在未实现拼音化之前通过阶梯工程的26个符号即可主宰计算机语
言,攀登信息技术的高峰。
1、符号的设定:根据1958年周总理在“当前文字改革的任务”报告中指出:“汉语
决定采用拉丁字母为拼音字母”应当确定这样一条原则”;本发明遵守这一原则,采
用拉丁字母。
2、符号的排序:根据我国现行汉语拼音和近百年来的拼音历史的习惯,都是以声
母为主体的b p m f,--为序列,因为它符合汉语声母在前排列的规律。为进一步提
高其科学性、在单元组合上作了对称性、压韵性的必要的调整,构成拼音系统骨架
结构的排序:
b p m f g k h z c s i u y
d t n l j q x v(zh)a(ch)w(sh) o e r
3、音素的标定:音素是由语言自然形成的基本语音元素,它划分声母和韵母两类。
以“汉语拼音方案”(以下简称“汉拼”)为例:设定声母为21个,韵母34个(共55个
音素)。经本案的研发,实际的声母是26个,韵母是34个共计60个音素。“汉拼”
短缺音素的标定:是把5个中性音素的字母i、u、y、o、e、仅列入行列,并未列
入声母行列。它是双重任务的符号,就必须双方列入,否则声母方缺少了5个音素,
将造成总音节数,短缺170个音节(5×34)=短缺680个调节,不能表达全部汉语音
调数,因此必须补充列入5个声母,达到原26个声母的实际。
4、符号的标音:用26符号进行承载60个音素,叫做符号标音。“汉拼”采用一音
多符制(复合韵母)的标音法。与本发明的“汉语输入法“一符多音制的标音(采用双发
音方法取代“汉拼”一音多符制的标音)相比,不仅取得语音双输入的同步性,同时
也把符号的标音效率提高一倍。
汉语三一代码技术(1959-1998)
″汉拼″是由声,韵,调三种元素用三种码符来表达的。″三一代码″是经过优化把三
种元素,用一种码符来完成。每个代码都是声码,把它放在韵码位置上代替韵码,
又都是韵码。把大写代码代入字间标示四调,它还是调码,故叫“汉语三一代
码”(简称汉码)。
一.双发音法则:每个代码在单独或声码位置发声码音.在韵码位置,发韵码音,如
下:
b p m f g k h
玻-耶 坡-腰 摸-烟 佛-英 哥-昂 克-亨 喝-翁,佣
b-ie p-iao m-ian f-ing g-ang k-eng
ㄅ-ㄝ ㄆ-ㄧㄠ ㄇ-ㄧㄢ ㄈ-ㄧㄥ ㄍ-ㄤ ㄎ-ㄥ ㄏ-ㄨㄥ.ㄩㄥ
z c s i u y
资-安 疵-恩 思-优 一-一 乌-乌 迂-迂,歪
z-an c-en s-iu i-i u-u
ㄗ-ㄢ ㄘ-ㄣ ㄙ-ㄧㄡ ㄧ-ㄧ ㄨ-ㄨ ㄩ-ㄩ.ㄨㄞ
d t n l j q x
得-因 特-威,约 讷-弯,冤 勒-温,晕 基-哀 其-诶 西-奥
d-in j-ai q-ei x-ao
ㄉ-ㄧㄣ ㄊ-ㄨㄟ.ㄩㄝㄋ-ㄨㄢ.ㄩㄢ ㄌ-ㄨㄣ.ㄩㄣㄐ-ㄞ ㄑ-ㄟ ㄒ-ㄠ
v a w o e r
知-央,汪 吃-阿 尸-挖,呀 窝 恶 日-儿,欧
ch-a o-uo e-e
ㄓ-ㄧㄤ.ㄨㄤ 彳-ㄚ ㄕ-ㄨㄚ.ㄧㄚ ㄛ-ㄛ ㄜ-ㄜ ㄖ-儿.ㄡ
二.大写标调法:把大写代码,按规则写在声,韵码的位置,标示四调。单独小写
读一调,单独大写读四调。规则如下:
1调 2调 3调 4调
— / ∨
ma(妈) mA(麻) MA(马) Ma(骂)
小小 小大 大大 大小
三.汉语标符法:
1.韵符:″o″,每个代码单独使用发声母音。如需发韵母亲音时,则在代码前加[0]
例如:(安全)″ozqN″.
2.点符:“‘”,在音节之前标示须省目的人、地名。如(北京)“’BQjf。(一般不标注)。
两个代码,在相拼位置而不应相拼时,则在两码之间上部,用[’]隔开,例如:(哥
哥)″g’g″(此规定为手写时使用)。点符在音节之尾,标示″轻声″,如:(东西)指物件
“dhxi’”[轻声]。
3.空符:书写语言以词组为原则,每一个词组之间加空格符以示划分。如:
举例:(从此 中国人 有了 自己 语言 主宰 的 电脑)(16字)
汉拼:cóngcǐzhònggǘorén yǒule zījǐyǚián zhǚzǎidēdiǎnnǎo(45+16=61符)
汉码:cHCI vhGOrC IRle ZiJI YYiZ VUZJ de DmNX.(32符)
(单音表)
声码单音符:
bo po mo fo ge ke he zi ci si ii uu yy(uj)
de te ne le ji qi xi vi ai wi oo ee ri
韵码单音符:
ib ip im if og ok oh’yh oz oc os
(ie)(ix)(iz) (hk) (uk) (ir)
id uq yt uz yn uc yl oj oq ox og ig oa ow ia oo ee er or
注:(7个括弧的音节码,是3-1代码输入汉字软件的专用码)
5、音节和调节的计算:,音节公式:声母×韵母=音节(26×34=884个音节)。调节
公式:音节×4=调节(884×4=3536个)见音节表。
HzYY 3-1DjMA idJBBP(汉语三一代码音节表)
(汉字一声注音)
b p m f g k h’ h z c s i u y’y d t’t n’ n l’l j q x v’ v a w’w o e r’r 34
ie iao ian ing ang eng ong iog an en iou i u y uai in ui ve uan van un vn ai ei ao iag uag
a ua ia o e er ou (75)
椰 要 烟 英 昂 亨 翁 拥 安 恩 优 衣乌迂
歪 音 威 约 弯 冤 温 晕 埃 诶 奥 央 汪 阿 挖 压 窝额儿 欧 汉字
b玻
>bb bp bm bf bg bk bz be bi bu bd bj bq bx ba bo
<b玻
憋 标 鞭 兵 帮 绷 搬 奔 逼 不 宾
16
p坡
>pb pp pm pf pg pk pz pc pi pu pd pj pq px pa po p
r <p坡
撇 漂 篇 乒 乓 烹 潘 喷 坯 扑 拼
17
m摸>mb mp mm mf mg mk mz
mc ms mi mu md mj mq mx ma mo me mr <m
咩 喵’棉’名’忙 蒙 ’蛮 闷 谬 眯’模 ’民
没 猫 妈 摸 么 哞 19
f佛> fg fk fz fc fu fq fa fa fr <f
音节数
掰 杯 包 八 玻
拍 呸 抛 啪 坡 剖
摸
’埋’
佛
方 风 帆 分 夫 飞 发 佛 否 9
g哥> gg gk gh gz gc gu gy gt gn gl gj
gq gx gv ga gw go ge gr <g哥
缸 耕 工 杆 根 姑 乖 龟 官 滚 该 给 高
沟 19
k科
> kg kk kh kz kc ku ky kt kn kl kj kx kv ka kw ko ke
kr <k科
康 坑 空 刊 肯 哭 蒯 亏 宽 昆 开 考
抠 18
h喝
> hg hk hh hz hc hu hy ht hn hl hj hq hx hv ha hw ho he
hr <h喝
夯 哼 哄 鼾’
痕 呼 坏 灰 欢 荤 亥 黑 蒿 荒 哈 呼 豁 喝 吼 19
z资
> zg zk zh zz zc zi zu zt zn zl zj zq zx za zo ze zr
<z资
脏 增 宗 簪 怎 资 租 嘴 躜 尊 栽 贼 遭
光 旮 瓜 锅 哥
筐 咖 夸 扩 科
匝 作 责 邹
17
c疵
> cg ck ch cz cc ci cu ct cn cl cj ex ca co ce cr
<c疵
仓 层 丛 餐 岑 疵 粗
16
s思
> sg sk sh sz sc si su st sn sl sj sx sa so se sr <
;s思
桑 僧 松 三 森 思 酥
16
i衣
> if ig ih iz ii id in il ix ia io ie ir
<i衣
应 央 拥 烟 衣 因
u乌
> ug uk uz uc uu uj uq ua uo
<u乌
汪 翁 弯 温 乌
y迂
催 汆 村 猜 操 擦 撮 册 凑
虽 酸 孙 腮 搔 仨 缩 色 搜
鸳 晕 要 压 哟 也 优 13
歪 威 挖 窝 9
> yz yy yt yn yl &l
t;y迂
淹 迂 约 鸳 晕 5
193.
b p m f g k h’ h z c s i u y’y d t’t n’ n l’l j q x v’ v a w’w o e r’r
34
ie iao ian ing ang eng ong iog an en iou i u y uai in ui ve uan van un vn ai ei ao iag u
ag a ua ia o e er ou (75)
耶 腰 烟 英 昂 亨 翁 拥 安 恩 优 衣 乌 迂 歪 音 威 约 弯 冤 温 晕 埃 诶 奥
央 汪 阿挖 压 喔恶儿 欧
d得
> db dp dm df dg dk dh dz ds di du dt dn dl dj dx da dw do
de dr <d得
爹 刁 颠 丁 当 灯 东 丹 丢 低 都 堆 端 吨 呆 刀 搭 嗲 多
得 兜 21
t特
> tb tp tm tf tg tk th tz ti tu tt tn tl tj tx ta to te tr
<t特
贴 挑 天 听 汤’
腾 通 摊 梯 凸 推 湍 吞 胎 滔 它 拖 特 偷 19
n讷
> nb np nm nf ng nk nh nz nc ns ni nu ny nd nt nn nj nq nx nv na
no ne nr <n讷
捏 尿 蔫 宁 囔 能 哝 喃 嫩 妞 妮 奴 女 您 虐 暖 奶 内 孬 酿 哪
诺 讷 耨 24
l勒
> lb lp lm lf lg lk lh lz ls li lu ly ld lt ln ll lj lq lx lv la lw lo le lr
<l勒
咧 撩’连 拎 啷 塄 咙 滥 馏’犁 噜 吕 啉 略 峦 抡 ’
来 嘞 捞 谅 拉 俩 落 勒 搂 25
j基
> jb jp jm jf jh js ji jy jd jt jn jl jv jw
<j基
接 交 间 经 炯 纠 机 鞠 巾 掘 捐 军 将 加
14
q其
> qb qp qm qf qh qs qi qy qd qt qn ql qx qv qw
<q其
切 悄 千 青 穷 秋 其 曲 亲 缺 圈 ’
群 敲 强 掐 15
x西
> xb xp xm xf xh xs xi xy xd xt xn xl xv xw
<x西
些 削 先 星 兄 休 西 须 新 薛 宣 勋 向 瞎
14
v-zh知
> vg vk vh vz vc vi vu vy vt vn vl vj vx vv va vw vo ve v
r <v知zh
张 争 中 毡 真 知 朱 拽 追 砖 谆 摘 昭 装 扎 抓 捉 蛰
舟 19
a-ch吃
> ag ak ah az ac ai au ay at an al aj ax av aa ao ae ar
<a吃ch
昌 撑 冲 掺 抻 持 出 揣 吹 穿 春 拆 抄 窗 插 绰 车
抽 18
w-sh师
> wg wk wz wc wi wu wy wt wn wl wj wx wv wa ww
wo we wr <w师sh
商 生 山 深 失 书 帅 睡 拴 吮 筛 梢 双 砂 刷 说 奢
收 18
o喔
> og oz oc oj ox oa oo oe &l
t;o窝
昂 安 恩 哀 奥 阿 哦 恶 7
e恶
> eg ez ec eu ej eq ex ea eo ee er
<e额
肮 俺 蒽 入 爱 诶 凹 吖 噢 额 二 11
r日
> rg rk rh rz rc ri ru rt rn rl rx ro re rr
<r日
嚷 仍 容 ’
然 认 日 洳 瑞 软 润 绕 弱 热 肉 14
b p m f g k h’ h z c s i u y’y d t’t n’ n l’l j q x v’ v a w’w o e r r’
ie iao ian ing ang eng ong iog an en iou i u y uai in ui ve uan van un vn ai ei ao iag u
ag a ua ia o e er ou (75)26
-
耶 要 烟 英 昂 亨 翁 拥 安 恩 欧 衣 乌 迂 歪 音 威 约 弯 冤 温 晕 埃 诶 奥 央
汪 阿 挖 压 窝额儿 欧 34
(’)(.)非
一声字 26.*34=884 193+219=412=0.46率
汉语的语音,是以调为主体,每一个音节均有四个音调。“汉语三一代码”声母音素
值26个,韵母是34个。汉语拼音实际音素总数的60个。通过计算全面音节884
个。为语音输入的语调库提供(4×884)=3536调节的基本数据。根据语调库的数据,
本案将录制男生、女生和儿童三种音调库,实现多种语音的输入。
三、语音输入的同步性:语音输入要求与汉语(字符)输入的同步 是属信息技术学
科的范畴。在实现与汉语输入法每敲两键输入两个字符的同时,由音调库中同步输
入的一个调节。要同步就必须与字符的输入的结构相同,才能取得语音与字符输入
的同步效果。由以下方法来决定。
1、标音的方法:在标音方法上采用同语言输入法相同的“双发音方法”既“一符多音
制”,是达到同步的关键之一。其原理:是利用“声母在前,韵母永远在后的规律,
把声母放在韵母的位置上代替韵母发音的方法。
一.双发音法则:每个代码在单独或声码位置发声码音.在韵码位置,发韵码音,如
下:
b p m f g k h
玻-耶 坡-腰 摸-烟 佛-英 哥-昂 克-亨 喝-翁,佣
b-ie p-iao m-ian f-ing g-ang k-eng
ㄅ-ㄝ ㄆ-ㄧㄠ ㄇ-ㄧㄢ ㄈ-ㄧㄥ ㄍ-ㄤ ㄎ-ㄥ ㄏ-ㄨㄥ.ㄩ ㄥ
z c s i u y
资-安 疵-恩 思-优 一-一 乌-乌 迂-迂,歪
z-an c-en s-iu i-i u-u
ㄗ-ㄢ ㄘ-ㄣ ㄙ-ㄧㄡ ㄧ-ㄧ ㄨ-ㄨ ㄩ-ㄩ.ㄨㄞ
d t n l j q x
得-因 特-威,约 讷-弯,冤 勒-温,晕 基-哀 其-诶 西-奥
d-in j-ai q-ei x-ao
ㄉ-ㄧㄣ ㄊ-ㄨㄟ.ㄩㄝ ㄋ-ㄨㄢ.ㄩㄢ ㄌ-ㄨㄣ.ㄩㄣ ㄐ-ㄞ ㄑ-ㄟ ㄒ-ㄠ
v a w o e r
知-央,汪 吃-阿 尸-挖,呀 窝 恶 日-儿,欧
ch-a o-uo e-e
ㄓ-ㄧㄤ.ㄨㄤ 彳-ㄚ ㄕ-ㄨㄚ.ㄧㄚ ㄛ-ㄛ ㄜ-ㄜ ㄖ-儿.ㄡ
2标调的方法:汉语拼音的四调标注法,是我国汉语拼音化和输入计算机的瓶径之
一。本发明的语音输入的标调法,是采用大写标调的无符标调法,把大写字母代入
双拼的字间来标示不同的四调,是实现双输同步的第二条件。
二.大写标调法:把大写代码,按规则写在声,韵码的位置,标示四调。单独小写
读一调,单独大写读四调。规则如下:
1调 2调 3调 4调
— / ∨
ma(妈) mA(麻) MA(马) Ma(骂)
小小 小大 大大 大小
2、汉语标符法:这是本发明构成在输入汉语(三一代码)字符与语音双输的第三条
件。在标符结构上与汉语输入法相同的设计,
三、汉语标符法:
1.韵符:″o″,每个代码单独使用发声码音。如需发韵码音时,则在代码前加[0]例
如:(安全)″ozqN″.
2.点符:“‘”,在音节之前标示须省目的人、地名。如(北京)“’BQjf。(一般不标注)。
两个代码,在相拼位置而不应相拼时,则在两码之间上部,用[’ ]隔开,例如:(哥
哥)″g’g″。(此规定为手写时使用)在音节之尾,标示″轻声″,如:(东西)指物件
“dhxi’”[轻声]。
3.空符:书写语言以词组为原则,每一个词组之间加空格符以示划分。如:以上从
结构完成输入系统的统一,取得双输同步的可行性。具体表现在每输两键,输入两
个字符的同时完成从3536个音调库中输入一组调节。实现计算机的字符与语音同
时共举的双输作用。
本发明的三一代码汉语计算机语音输入法的开发,是在我国没有拼音文字的情况下,
开发“信息语音学科”而必须以“汉语拼音学科”作为信息语音学科 “阶梯工程”,通
过交叉学科研发,从而使汉语取得攀登信息语音领域的成功。它的应用将打开了用
计算机讲汉语的平台。为启蒙学汉语、为方言地区推广普通话、为外国人学汉语走
上电子化简易化的道路。把世界上公认最难学的汉语变成易学的语言、为世界正在
兴起汉语热提供升温的热源。在信息语音领域独特的创建三一代码计算机语言、语
音双输的创新。标志着汉语首先走在世界信息语音技术领域的前沿。表现着中华民
族信息技术后来居上的特色。汉语语音软件的朗读声,将告示和证明了我国经过三
个多世纪耕耘的“汉语拼音工程“,在信息语音技术的阶梯工程中完满的诞生。为赶
上和超过发达国家在信息语言、语音领域奠定了可行的基础。
具体实施方式: 下列实施例用于说明本发明,但不限制在权利要求中阐明的范围。 实施例1举雷锋的故事选段,是用三一代码输入计算机的文件,把它调入在“三一 代码语音(讲话)3-1 J1。0软件”的平台上,定义之后按诵读按扭,即可从左到右按 三一代码字母诵读普通话。这表明把三一代码的选段的字母语音化。读完再按则再 读。 lQfk 雷锋 yN lQfk,Wi vhgO rCmD JBFgjl De iIGe PUth Zj DNDNDe 共产党员 雷锋,是 中国 人民解放军的一个普通战士。他在短短的Iiwk vh, Ih ZiJI gwhtde iZxF,XBXw Le i IBu xmhHDe strZ lIkj UO一生 中,用 自 己 光辉的 言行,写下了 一部 鲜红的 历史。他 虽然 离开 我 mC szwldonM Le Dz ta Na UQDaDe GhAZVUIi jfwc,Qt WIvh KeZj rCmCDe xdWg 们 三十多年 了,但 他 那 伟大的 共产主义 精神,却 始终 刻在人们的 心上, IHYN Wi UOmC xTXIDe BGIg.永远 是 我们 学习的 榜样。 实施例2 在“三一代码语音(讲话)3-1J 1。0软件”的平台上,从键盘输入三一代码任 何汉语语句每输两键平台输入两个字母的同时输入一个调节,连续输入连续发音达 到语句的输入。被输入的三一代码语句或文章,调入平台即可诵读普通话。
发布评论