2024年6月5日发(作者:)

(19)中华人民共和国国家知识产权局

(12)发明专利说明书

(21)申请号 CN2.4

(22)申请日 2005.06.15

(71)申请人 李丹

地址 100009 北京市东城区交道口西公街22号

(72)发明人 李丹

(74)专利代理机构

代理人

(51)

G06F3/023

权利要求说明书 说明书 幅图

(10)申请公布号 CN 1687885 A

(43)申请公布日 2005.10.26

(54)发明名称

三一代码汉语计算机语音输入法

(57)摘要

本发明是在一种三一代码汉语计算

机输入法技术上的升级,在输入汉语字符

的同时输入语音,达到每两键输入两个字

符就可同时输入一个语音,连续拼输就从

语词、语句到普通话的输入;为启蒙学汉

语,为方言地区推广普通话、为外国人学

汉语,走上电子化简易化的教学之路,把

世界上公认最难学的汉语变成易学的语

言。

法律状态

法律状态公告日

法律状态信息

法律状态

权 利 要 求 说 明 书

1、一种三一代码汉语计算机语音输入法,其特征在于由一个三一代码信息语音的

阶梯工程的汉语拼音系统工程的设计,取得汉语语音技术的全部材料;26个声母

的排序;汉语60音素;884音节;3536个调节;从而完成四调的语音库和同步输

入法,完成汉语和语音的同输法。

2、一种三一代码汉语计算机语音输入法,其特征在于同步输入的标音的双发音法、

无符大写标调法和汉语标符法。

3、一种三一代码汉语计算机语音输入法,其特征在于每敲两键输入两个字母,表

达一个音节,同时输入语音的一个调节,连续构成语词、语句和普通话。

说 明 书

技术领域

本发明涉及计算机语言、语音和汉语拼音的交叉学科。

背景技术

在已开发的“一种三一代码汉语计算机输入法”(专利号96 100728-1)的基础上,为进

一步对汉语输入计算机技术的升级,实现在汉语输入的同时,开发出汉语语音的输

入法。目前计算机输入的语言都是用输入字符来表达的。它只能通过视觉的阅读来

理解,而不能象人的语言通过听觉来接收,是计算机语言和人类语言存在的差异。

发明内容

本发明的任务;提供一种三一代码汉语计算机语音输入法,在用字符输入表达汉语

(三一代码)的同时,还可输入语音用听觉来接收,取得计算机的汉语(字符)和语音

双输的创新。三一代码(简称汉码)在输入计算机汉语的同时,要达到语音输入的条

件,必须创建汉语音调库。但是我国的语言尚未拼音化,就没有条件提供开发此项

信息语音技术的数据!当前是等待我国实现拼音化之后再来开发信息技术呢?还是

响应号召开展“交叉学科”的研究;把汉语拼音学科作为实现信息学科的一项“阶梯

工程”来研发?这属于没有条件创造条件也要上的开发路线,无疑后者是符合加速

振兴中华的战略。

本发明的技术方案是:

1、一种三一代码汉语计算机语音输入法,其特征在于由一个三一代码信息语音的

阶梯

工程的汉语拼音系统工程的设计,取得汉语语音技术的全部材料;26个声母的排

序;汉语60音素;884音节;3536个调节;从而完成四调的语音库和同步输入法,

完成汉语和语音的同输法。

2、一种三一代码汉语计算机语音输入法,其特征在于同步输入的标音的双发音法、

无符大写标调法和汉语标符法。

3、一种三一代码汉语计算机语音输入法,其特征在于每敲两键输入两个字母,表

达一个音节,同时输入语音的一个调节,连续构成语词、语句和普通话。

一,系统性开发阶梯工程:汉语是一种以调为主体的四调语言,在语音输入上是要

创建四调的语调库;语调库的数据是出自完整的汉语拼音系统工程,做为信息语音

的前提;要实现语音输入必须把它作为信息语音技术“阶梯工程”而设计。要从表达

音素的符号设计、符号的排序、符号的标音、符号音素的划分;声、韵字母数额的

标定、声韵音素的计算,才能取得汉语实际音节的数据和音调的数据,构成语调库

的数据条件。

二,阶梯工程的设计:是以现行“汉语拼音方案”(简称“汉拼”)为基础,通过以下的

程序,把“汉语拼音学科”系统化;取得语调库的各项数据,完成信息技术的阶梯工

程,从而使我国在未实现拼音化之前通过阶梯工程的26个符号即可主宰计算机语

言,攀登信息技术的高峰。

1、符号的设定:根据1958年周总理在“当前文字改革的任务”报告中指出:“汉语

决定采用拉丁字母为拼音字母”应当确定这样一条原则”;本发明遵守这一原则,采

用拉丁字母。

2、符号的排序:根据我国现行汉语拼音和近百年来的拼音历史的习惯,都是以声

母为主体的b p m f,--为序列,因为它符合汉语声母在前排列的规律。为进一步提

高其科学性、在单元组合上作了对称性、压韵性的必要的调整,构成拼音系统骨架

结构的排序:

b p m f g k h z c s i u y

d t n l j q x v(zh)a(ch)w(sh) o e r

3、音素的标定:音素是由语言自然形成的基本语音元素,它划分声母和韵母两类。

以“汉语拼音方案”(以下简称“汉拼”)为例:设定声母为21个,韵母34个(共55个

音素)。经本案的研发,实际的声母是26个,韵母是34个共计60个音素。“汉拼”

短缺音素的标定:是把5个中性音素的字母i、u、y、o、e、仅列入行列,并未列

入声母行列。它是双重任务的符号,就必须双方列入,否则声母方缺少了5个音素,

将造成总音节数,短缺170个音节(5×34)=短缺680个调节,不能表达全部汉语音

调数,因此必须补充列入5个声母,达到原26个声母的实际。

4、符号的标音:用26符号进行承载60个音素,叫做符号标音。“汉拼”采用一音

多符制(复合韵母)的标音法。与本发明的“汉语输入法“一符多音制的标音(采用双发

音方法取代“汉拼”一音多符制的标音)相比,不仅取得语音双输入的同步性,同时

也把符号的标音效率提高一倍。

汉语三一代码技术(1959-1998)

″汉拼″是由声,韵,调三种元素用三种码符来表达的。″三一代码″是经过优化把三

种元素,用一种码符来完成。每个代码都是声码,把它放在韵码位置上代替韵码,

又都是韵码。把大写代码代入字间标示四调,它还是调码,故叫“汉语三一代

码”(简称汉码)。

一.双发音法则:每个代码在单独或声码位置发声码音.在韵码位置,发韵码音,如

下:

b p m f g k h

玻-耶 坡-腰 摸-烟 佛-英 哥-昂 克-亨 喝-翁,佣

b-ie p-iao m-ian f-ing g-ang k-eng

ㄅ-ㄝ ㄆ-ㄧㄠ ㄇ-ㄧㄢ ㄈ-ㄧㄥ ㄍ-ㄤ ㄎ-ㄥ ㄏ-ㄨㄥ.ㄩㄥ

z c s i u y

资-安 疵-恩 思-优 一-一 乌-乌 迂-迂,歪

z-an c-en s-iu i-i u-u

ㄗ-ㄢ ㄘ-ㄣ ㄙ-ㄧㄡ ㄧ-ㄧ ㄨ-ㄨ ㄩ-ㄩ.ㄨㄞ

d t n l j q x

得-因 特-威,约 讷-弯,冤 勒-温,晕 基-哀 其-诶 西-奥

d-in j-ai q-ei x-ao

ㄉ-ㄧㄣ ㄊ-ㄨㄟ.ㄩㄝㄋ-ㄨㄢ.ㄩㄢ ㄌ-ㄨㄣ.ㄩㄣㄐ-ㄞ ㄑ-ㄟ ㄒ-ㄠ

v a w o e r

知-央,汪 吃-阿 尸-挖,呀 窝 恶 日-儿,欧

ch-a o-uo e-e

ㄓ-ㄧㄤ.ㄨㄤ 彳-ㄚ ㄕ-ㄨㄚ.ㄧㄚ ㄛ-ㄛ ㄜ-ㄜ ㄖ-儿.ㄡ

二.大写标调法:把大写代码,按规则写在声,韵码的位置,标示四调。单独小写

读一调,单独大写读四调。规则如下:

1调 2调 3调 4调

— / ∨

ma(妈) mA(麻) MA(马) Ma(骂)

小小 小大 大大 大小

三.汉语标符法:

1.韵符:″o″,每个代码单独使用发声母音。如需发韵母亲音时,则在代码前加[0]

例如:(安全)″ozqN″.

2.点符:“‘”,在音节之前标示须省目的人、地名。如(北京)“’BQjf。(一般不标注)。

两个代码,在相拼位置而不应相拼时,则在两码之间上部,用[’]隔开,例如:(哥

哥)″g’g″(此规定为手写时使用)。点符在音节之尾,标示″轻声″,如:(东西)指物件

“dhxi’”[轻声]。

3.空符:书写语言以词组为原则,每一个词组之间加空格符以示划分。如:

举例:(从此 中国人 有了 自己 语言 主宰 的 电脑)(16字)

汉拼:cóngcǐzhònggǘorén yǒule zījǐyǚián zhǚzǎidēdiǎnnǎo(45+16=61符)

汉码:cHCI vhGOrC IRle ZiJI YYiZ VUZJ de DmNX.(32符)

(单音表)

声码单音符:

bo po mo fo ge ke he zi ci si ii uu yy(uj)

de te ne le ji qi xi vi ai wi oo ee ri

韵码单音符:

ib ip im if og ok oh’yh oz oc os

(ie)(ix)(iz) (hk) (uk) (ir)

id uq yt uz yn uc yl oj oq ox og ig oa ow ia oo ee er or

注:(7个括弧的音节码,是3-1代码输入汉字软件的专用码)

5、音节和调节的计算:,音节公式:声母×韵母=音节(26×34=884个音节)。调节

公式:音节×4=调节(884×4=3536个)见音节表。

HzYY 3-1DjMA idJBBP(汉语三一代码音节表)

(汉字一声注音)

b p m f g k h’ h z c s i u y’y d t’t n’ n l’l j q x v’ v a w’w o e r’r 34

ie iao ian ing ang eng ong iog an en iou i u y uai in ui ve uan van un vn ai ei ao iag uag

a ua ia o e er ou (75)

椰 要 烟 英 昂 亨 翁 拥 安 恩 优 衣乌迂

歪 音 威 约 弯 冤 温 晕 埃 诶 奥 央 汪 阿 挖 压 窝额儿 欧 汉字

b玻

>bb bp bm bf bg bk bz be bi bu bd bj bq bx ba bo

<b玻

憋 标 鞭 兵 帮 绷 搬 奔 逼 不 宾

16

p坡

>pb pp pm pf pg pk pz pc pi pu pd pj pq px pa po p

r <p坡

撇 漂 篇 乒 乓 烹 潘 喷 坯 扑 拼

17

m摸>mb mp mm mf mg mk mz

mc ms mi mu md mj mq mx ma mo me mr <m

咩 喵’棉’名’忙 蒙 ’蛮 闷 谬 眯’模 ’民

没 猫 妈 摸 么 哞 19

f佛> fg fk fz fc fu fq fa fa fr <f

音节数

掰 杯 包 八 玻

拍 呸 抛 啪 坡 剖

’埋’

方 风 帆 分 夫 飞 发 佛 否 9

g哥> gg gk gh gz gc gu gy gt gn gl gj

gq gx gv ga gw go ge gr <g哥

缸 耕 工 杆 根 姑 乖 龟 官 滚 该 给 高

沟 19

k科

> kg kk kh kz kc ku ky kt kn kl kj kx kv ka kw ko ke

kr <k科

康 坑 空 刊 肯 哭 蒯 亏 宽 昆 开 考

抠 18

h喝

> hg hk hh hz hc hu hy ht hn hl hj hq hx hv ha hw ho he

hr <h喝

夯 哼 哄 鼾’

痕 呼 坏 灰 欢 荤 亥 黑 蒿 荒 哈 呼 豁 喝 吼 19

z资

> zg zk zh zz zc zi zu zt zn zl zj zq zx za zo ze zr

<z资

脏 增 宗 簪 怎 资 租 嘴 躜 尊 栽 贼 遭

光 旮 瓜 锅 哥

筐 咖 夸 扩 科

匝 作 责 邹

17

c疵

> cg ck ch cz cc ci cu ct cn cl cj ex ca co ce cr

<c疵

仓 层 丛 餐 岑 疵 粗

16

s思

> sg sk sh sz sc si su st sn sl sj sx sa so se sr <

;s思

桑 僧 松 三 森 思 酥

16

i衣

> if ig ih iz ii id in il ix ia io ie ir

<i衣

应 央 拥 烟 衣 因

u乌

> ug uk uz uc uu uj uq ua uo

<u乌

汪 翁 弯 温 乌

y迂

催 汆 村 猜 操 擦 撮 册 凑

虽 酸 孙 腮 搔 仨 缩 色 搜

鸳 晕 要 压 哟 也 优 13

歪 威 挖 窝 9

> yz yy yt yn yl &l

t;y迂

淹 迂 约 鸳 晕 5

193.

b p m f g k h’ h z c s i u y’y d t’t n’ n l’l j q x v’ v a w’w o e r’r

34

ie iao ian ing ang eng ong iog an en iou i u y uai in ui ve uan van un vn ai ei ao iag u

ag a ua ia o e er ou (75)

耶 腰 烟 英 昂 亨 翁 拥 安 恩 优 衣 乌 迂 歪 音 威 约 弯 冤 温 晕 埃 诶 奥

央 汪 阿挖 压 喔恶儿 欧

d得

> db dp dm df dg dk dh dz ds di du dt dn dl dj dx da dw do

de dr <d得

爹 刁 颠 丁 当 灯 东 丹 丢 低 都 堆 端 吨 呆 刀 搭 嗲 多

得 兜 21

t特

> tb tp tm tf tg tk th tz ti tu tt tn tl tj tx ta to te tr

<t特

贴 挑 天 听 汤’

腾 通 摊 梯 凸 推 湍 吞 胎 滔 它 拖 特 偷 19

n讷

> nb np nm nf ng nk nh nz nc ns ni nu ny nd nt nn nj nq nx nv na

no ne nr <n讷

捏 尿 蔫 宁 囔 能 哝 喃 嫩 妞 妮 奴 女 您 虐 暖 奶 内 孬 酿 哪

诺 讷 耨 24

l勒

> lb lp lm lf lg lk lh lz ls li lu ly ld lt ln ll lj lq lx lv la lw lo le lr

<l勒

咧 撩’连 拎 啷 塄 咙 滥 馏’犁 噜 吕 啉 略 峦 抡 ’

来 嘞 捞 谅 拉 俩 落 勒 搂 25

j基

> jb jp jm jf jh js ji jy jd jt jn jl jv jw

<j基

接 交 间 经 炯 纠 机 鞠 巾 掘 捐 军 将 加

14

q其

> qb qp qm qf qh qs qi qy qd qt qn ql qx qv qw

<q其

切 悄 千 青 穷 秋 其 曲 亲 缺 圈 ’

群 敲 强 掐 15

x西

> xb xp xm xf xh xs xi xy xd xt xn xl xv xw

<x西

些 削 先 星 兄 休 西 须 新 薛 宣 勋 向 瞎

14

v-zh知

> vg vk vh vz vc vi vu vy vt vn vl vj vx vv va vw vo ve v

r <v知zh

张 争 中 毡 真 知 朱 拽 追 砖 谆 摘 昭 装 扎 抓 捉 蛰

舟 19

a-ch吃

> ag ak ah az ac ai au ay at an al aj ax av aa ao ae ar

<a吃ch

昌 撑 冲 掺 抻 持 出 揣 吹 穿 春 拆 抄 窗 插 绰 车

抽 18

w-sh师

> wg wk wz wc wi wu wy wt wn wl wj wx wv wa ww

wo we wr <w师sh

商 生 山 深 失 书 帅 睡 拴 吮 筛 梢 双 砂 刷 说 奢

收 18

o喔

> og oz oc oj ox oa oo oe &l

t;o窝

昂 安 恩 哀 奥 阿 哦 恶 7

e恶

> eg ez ec eu ej eq ex ea eo ee er

<e额

肮 俺 蒽 入 爱 诶 凹 吖 噢 额 二 11

r日

> rg rk rh rz rc ri ru rt rn rl rx ro re rr

<r日

嚷 仍 容 ’

然 认 日 洳 瑞 软 润 绕 弱 热 肉 14

b p m f g k h’ h z c s i u y’y d t’t n’ n l’l j q x v’ v a w’w o e r r’

ie iao ian ing ang eng ong iog an en iou i u y uai in ui ve uan van un vn ai ei ao iag u

ag a ua ia o e er ou (75)26

-

耶 要 烟 英 昂 亨 翁 拥 安 恩 欧 衣 乌 迂 歪 音 威 约 弯 冤 温 晕 埃 诶 奥 央

汪 阿 挖 压 窝额儿 欧 34

(’)(.)非

一声字 26.*34=884 193+219=412=0.46率

汉语的语音,是以调为主体,每一个音节均有四个音调。“汉语三一代码”声母音素

值26个,韵母是34个。汉语拼音实际音素总数的60个。通过计算全面音节884

个。为语音输入的语调库提供(4×884)=3536调节的基本数据。根据语调库的数据,

本案将录制男生、女生和儿童三种音调库,实现多种语音的输入。

三、语音输入的同步性:语音输入要求与汉语(字符)输入的同步 是属信息技术学

科的范畴。在实现与汉语输入法每敲两键输入两个字符的同时,由音调库中同步输

入的一个调节。要同步就必须与字符的输入的结构相同,才能取得语音与字符输入

的同步效果。由以下方法来决定。

1、标音的方法:在标音方法上采用同语言输入法相同的“双发音方法”既“一符多音

制”,是达到同步的关键之一。其原理:是利用“声母在前,韵母永远在后的规律,

把声母放在韵母的位置上代替韵母发音的方法。

一.双发音法则:每个代码在单独或声码位置发声码音.在韵码位置,发韵码音,如

下:

b p m f g k h

玻-耶 坡-腰 摸-烟 佛-英 哥-昂 克-亨 喝-翁,佣

b-ie p-iao m-ian f-ing g-ang k-eng

ㄅ-ㄝ ㄆ-ㄧㄠ ㄇ-ㄧㄢ ㄈ-ㄧㄥ ㄍ-ㄤ ㄎ-ㄥ ㄏ-ㄨㄥ.ㄩ ㄥ

z c s i u y

资-安 疵-恩 思-优 一-一 乌-乌 迂-迂,歪

z-an c-en s-iu i-i u-u

ㄗ-ㄢ ㄘ-ㄣ ㄙ-ㄧㄡ ㄧ-ㄧ ㄨ-ㄨ ㄩ-ㄩ.ㄨㄞ

d t n l j q x

得-因 特-威,约 讷-弯,冤 勒-温,晕 基-哀 其-诶 西-奥

d-in j-ai q-ei x-ao

ㄉ-ㄧㄣ ㄊ-ㄨㄟ.ㄩㄝ ㄋ-ㄨㄢ.ㄩㄢ ㄌ-ㄨㄣ.ㄩㄣ ㄐ-ㄞ ㄑ-ㄟ ㄒ-ㄠ

v a w o e r

知-央,汪 吃-阿 尸-挖,呀 窝 恶 日-儿,欧

ch-a o-uo e-e

ㄓ-ㄧㄤ.ㄨㄤ 彳-ㄚ ㄕ-ㄨㄚ.ㄧㄚ ㄛ-ㄛ ㄜ-ㄜ ㄖ-儿.ㄡ

2标调的方法:汉语拼音的四调标注法,是我国汉语拼音化和输入计算机的瓶径之

一。本发明的语音输入的标调法,是采用大写标调的无符标调法,把大写字母代入

双拼的字间来标示不同的四调,是实现双输同步的第二条件。

二.大写标调法:把大写代码,按规则写在声,韵码的位置,标示四调。单独小写

读一调,单独大写读四调。规则如下:

1调 2调 3调 4调

— / ∨

ma(妈) mA(麻) MA(马) Ma(骂)

小小 小大 大大 大小

2、汉语标符法:这是本发明构成在输入汉语(三一代码)字符与语音双输的第三条

件。在标符结构上与汉语输入法相同的设计,

三、汉语标符法:

1.韵符:″o″,每个代码单独使用发声码音。如需发韵码音时,则在代码前加[0]例

如:(安全)″ozqN″.

2.点符:“‘”,在音节之前标示须省目的人、地名。如(北京)“’BQjf。(一般不标注)。

两个代码,在相拼位置而不应相拼时,则在两码之间上部,用[’ ]隔开,例如:(哥

哥)″g’g″。(此规定为手写时使用)在音节之尾,标示″轻声″,如:(东西)指物件

“dhxi’”[轻声]。

3.空符:书写语言以词组为原则,每一个词组之间加空格符以示划分。如:以上从

结构完成输入系统的统一,取得双输同步的可行性。具体表现在每输两键,输入两

个字符的同时完成从3536个音调库中输入一组调节。实现计算机的字符与语音同

时共举的双输作用。

本发明的三一代码汉语计算机语音输入法的开发,是在我国没有拼音文字的情况下,

开发“信息语音学科”而必须以“汉语拼音学科”作为信息语音学科 “阶梯工程”,通

过交叉学科研发,从而使汉语取得攀登信息语音领域的成功。它的应用将打开了用

计算机讲汉语的平台。为启蒙学汉语、为方言地区推广普通话、为外国人学汉语走

上电子化简易化的道路。把世界上公认最难学的汉语变成易学的语言、为世界正在

兴起汉语热提供升温的热源。在信息语音领域独特的创建三一代码计算机语言、语

音双输的创新。标志着汉语首先走在世界信息语音技术领域的前沿。表现着中华民

族信息技术后来居上的特色。汉语语音软件的朗读声,将告示和证明了我国经过三

个多世纪耕耘的“汉语拼音工程“,在信息语音技术的阶梯工程中完满的诞生。为赶

上和超过发达国家在信息语言、语音领域奠定了可行的基础。

具体实施方式:

下列实施例用于说明本发明,但不限制在权利要求中阐明的范围。

实施例1举雷锋的故事选段,是用三一代码输入计算机的文件,把它调入在“三一

代码语音(讲话)3-1 J1。0软件”的平台上,定义之后按诵读按扭,即可从左到右按

三一代码字母诵读普通话。这表明把三一代码的选段的字母语音化。读完再按则再

读。

lQfk

雷锋

yN lQfk,Wi vhgO rCmD JBFgjl De iIGe PUth Zj DNDNDe

共产党员 雷锋,是 中国 人民解放军的一个普通战士。他在短短的Iiwk vh,

Ih ZiJI gwhtde iZxF,XBXw Le i IBu xmhHDe strZ lIkj UO一生 中,用 自

己 光辉的 言行,写下了 一部 鲜红的 历史。他 虽然 离开 我

mC szwldonM Le Dz ta Na UQDaDe GhAZVUIi jfwc,Qt WIvh KeZj rCmCDe xdWg

们 三十多年 了,但 他 那 伟大的 共产主义 精神,却 始终 刻在人们的 心上,

IHYN Wi UOmC xTXIDe BGIg.永远 是 我们 学习的 榜样。

实施例2 在“三一代码语音(讲话)3-1J 1。0软件”的平台上,从键盘输入三一代码任

何汉语语句每输两键平台输入两个字母的同时输入一个调节,连续输入连续发音达

到语句的输入。被输入的三一代码语句或文章,调入平台即可诵读普通话。