对比文件名称:2003-03-28_JP2003091298A_发明专利_JP2003091298A Automatic control of household activity using speech recognition and natural language
目标专利名称:282自动化系统的语音控制配置CN104823411B
本次调用模型名称:DeepSeek
### 特征比对表格
| 技术特征描述以及公开性判断结果 | 对比文件原文引用 | 公开性论述 |
| **A**:所述方法包括:由计算机服务器来检测经由计算机网络与所述计算机服务器进行通信的所述电器《隐含公开》 | 图1示出家庭活动控制系统,包括计算机网络10。网络10上连接有各种设备(如器具18、计算机20等)。语音识别和自然语言处理系统30也连接到网络10(参见说明书第【0018】-【0022】段)。 | 对比文件公开了一个家庭网络(计算机网络10),各种家电设备(器具18等)连接至该网络。系统30(作为语音识别和自然语言处理的核心)也连接至该网络,并能够通过网络与各种设备进行通信。虽然没有明确使用“检测”一词,但本领域技术人员可以理解,系统30作为网络中的一个服务节点,必然能够感知和识别到与其通信的网络设备,否则无法实现后续的语音控制功能。因此,对比文件隐含公开了计算机服务器(系统30)检测经由计算机网络(网络10)与其通信的电器(器具18)。 |
| **B**:由所述计算机服务器来接收指示所述电器的能力的信息《隐含公开》 | “各装置のために電子作業ガイドを分割すると、システムを設計する際に、このガイドのプログラミング及びトラブルシューティングがより容易になる。”(为每个设备分别设置电子作业指南,在进行系统设计时,该指南的编程和故障排除会更容易。)(参见说明书第【0025】段)。以及,以冰箱为例,其对应的电子作业指南包含了冰箱内物品的信息,用于生成可能的晚餐菜单(参见说明书第【0011】段)。 | 对比文件公开了为网络中的每个设备(如冰箱)设置对应的“電子作業ガイド”(电子作业指南,EAG)。该指南包含了与该设备相关的特定信息,例如冰箱的内容物,这些信息定义了设备的功能或状态(即“能力”)。系统30通过访问这些电子作业指南来获取设备信息。这对应于接收指示电器能力的信息。虽然对比文件未明确使用“能力”一词,但电子作业指南存储的设备特定信息(如内容物、可执行的操作)实质上是设备能力的体现。因此,该特征被对比文件隐含公开。 |
| **C**:由所述计算机服务器来接收来自用户的、由电声变换器转换为音频信号的音频输入《直接公开》 | “好ましい実施形態における、音声認識及び自然言語処理システム 30 は、入力音声が供給される1つ以上のマイクロフォン 32 を備えている。... マイクロフォンへの入力は、音声入力処理モジュール 34 に供給され、ここで、入力音声はデジタル化され、音声認識装置 36 が必要とする形式に変換される。”(在优选实施例中,语音识别和自然语言处理系统30具备一个或多个麦克风32,输入语音被供给至该处。... 对麦克风的输入被供给至语音输入处理模块34,在此,输入语音被数字化,并转换为语音识别装置36所需的形式。)(参见说明书第【0023】段)。 | 对比文件明确公开了系统30(相当于计算机服务器)通过麦克风32(电声变换器)接收用户的音频输入,并由语音输入处理模块34将其转换为(数字)音频信号。这直接对应于目标专利中“接收来自用户的、由电声变换器转换为音频信号的音频输入”的技术特征。 |
| **D**:由所述计算机服务器通过将所述音频信号处理为数字文本数据来确定用于所述电器的配置信息,《直接公开》 | “音声認識装置 36 は、予め調整され、もしくは適合された複数の音声モデル 38 のセットを有していて、これらの音声モデルは、話された発声をテキストの形式または記号の形式に変換するために、前記認識装置によって用いられる。”(语音识别装置36具有一组预先调整或适配的多个语音模型38,这些语音模型被该识别装置用于将说出的话语转换为文本形式或符号形式。)(参见说明书第【0024】段)。 “自然言語対話モジュールは、ユーザの入力音声の意味内容(semantic content)すなわち意味(meaning)を確かめ、ネットワーク 10を介して通信している、対応する装置に適切な命令を与える。”(自然语言对话模块确认用户输入语音的语义内容即含义,并向通过网络10通信的对应设备发出适当的指令。)(参见说明书第【0026】段)。 | 对比文件明确公开了语音识别装置36将音频信号转换为文本或符号形式(即数字文本数据)。随后,自然语言对话模块40对该文本进行语义分析,理解用户意图,从而确定要执行的操作或命令。这些操作或命令即为用于控制电器的“配置信息”。因此,对比文件直接公开了通过处理音频信号为文本数据来确定配置信息的过程。 |
| **E**:其中,所述配置信息包括用于控制所述电器的所述能力的控制设置《隐含公开》 | 用户可以对冰箱说:“今夜はチキンシチューを作ろうと思う。買い物リストをプリントして下さい。”(我想今晚做鸡肉炖菜。请打印购物清单。)。系统随后会检查冰箱中缺少的物品,并向用户的计算机发送打印任务(参见说明书第【0011】段)。 用户可以说:“メル ブルックス主演で、1月23日以前に放映されるコメディを録画して下さい。”(请录制由梅尔·布鲁克斯主演、在1月23日之前播放的喜剧。)(参见说明书第【0036】段)。 | 对比文件中,用户通过语音命令控制电器执行特定操作,例如打印购物清单、录制电视节目。系统解析语音后确定的用户意图(如“打印清单”、“录制节目”)以及相关的参数(如时间“1月23日前”、演员“梅尔·布鲁克斯”),实质上就是用于控制电器能力的“控制设置”。虽然对比文件未明确使用“控制设置”这一术语,但本领域技术人员可以毫无疑义地理解,系统根据用户语音确定的、使电器执行特定功能或操作的指令集合,就是控制设置。因此,该特征被隐含公开。 |
| **F**:其中,所述控制设置包括以下各项中的至少一项:与所述电器被上电或者断电的一个或多个时间相对应的调度《隐含公开》 | 用户说:“メル ブルックス主演で、1月23日以前に放映されるコメディを録画して下さい。”(请录制由梅尔·布鲁克斯主演、在1月23日之前播放的喜剧。)(参见说明书第【0036】段)。 该命令中包含时间条件“1月23日以前”,这指示了录像机执行录制操作的时间范围,实质上是一种基于时间的调度。 | 对比文件公开了用户通过语音命令预约录制节目,该命令中包含了时间元素(“1月23日以前”)。这相当于为电器(录像机)设定了一个在特定时间条件(在某个时间点之前)下执行操作(录制)的调度。虽然目标专利中“上电/断电”是更具体的操作,但“调度”的核心概念是基于时间控制电器执行某操作,对比文件已公开此概念。因此,该特征被对比文件隐含公开。 |
| **G**:将所述电器的配置推迟至稍后的时间的设置《隐含公开》 | “多くの場合には、ユーザが何を行おうとしているのかを割り出すために、一連の対話が必要になる。”(在许多情况下,需要一系列对话来确定用户想要做什么。)(参见说明书第【0030】段)。 “対話マネージャ 124が用いられている。この対話マネージャ 124 は、自然言語パーサー 112 を用いて、ユーザの要求をかみくだき、画面上に表示されるか、あるいは合成音声によって提示される、意味をなすものにする。”(使用对话管理器124。该对话管理器124使用自然语言解析器112来分解用户请求,使其成为在屏幕上显示或通过合成语音呈现的有意义内容。)(参见说明书第【0031】段)。 | 对比文件描述了系统通过对话管理器与用户进行交互,以澄清或获取完整的用户意图。这意味着系统可能不会在单次语音输入后就完成所有配置,而是通过多次问答来逐步确定。这种交互过程本身允许“将配置推迟至稍后的时间”以获取更多信息。虽然对比文件未明确记载“推迟设置”这一选项,但本领域技术人员可以合理推断,在复杂的语音交互系统中,当初始信息不足时,系统可以暂不执行最终配置,等待用户后续输入,这等同于推迟配置。因此,该特征被隐含公开。 |
| **H**:或者当所述电器被上电时要由其执行的一个或多个操作《直接公开》 | 用户说:“買い物リストをプリントして下さい。”(请打印购物清单。)(参见说明书第【0011】段)。 用户说:“メル ブルックス主演で、1月23日以前に放映されるコメディを録画して下さい。”(请录制由梅尔·布鲁克斯主演、在1月23日之前播放的喜剧。)(参见说明书第【0036】段)。 | 对比文件明确公开了用户通过语音命令指示电器执行具体的操作,例如“打印购物清单”(打印机执行打印操作)、“录制节目”(录像机执行录制操作)。这些操作都是在电器处于工作(上电)状态时执行的。因此,“当电器被上电时要由其执行的一个或多个操作”这一特征被对比文件直接公开。 |
| **I**:根据所确定的配置信息来利用所述计算机服务器配置所述电器《隐含公开》 | “自然言語対話モジュールは、ユーザの入力音声の意味内容(semantic content)すなわち意味(meaning)を確かめ、ネットワーク 10を介して通信している、対応する装置に適切な命令を与える。”(自然语言对话模块确认用户输入语音的语义内容即含义,并向通过网络10通信的对应设备发出适当的指令。)(参见说明书第【0026】段)。 | 对比文件公开了系统(计算机服务器)在确定用户语音的语义(即配置信息)后,会向相应的网络设备发出适当的命令。发出命令这一行为,就是根据配置信息对电器进行控制或配置的过程。例如,命令录像机录制特定节目,即是配置该录像机。因此,该特征被对比文件隐含公开。 |
| **J**:以及利用输出变换器来输出指示所述电器的所述能力的语音信号。《直接公开》 | “自然言語対話モジュールは、テキストから音声を合成するテキスト−音声合成器 52 に接続されていて、このテキスト−音声合成器 52 は、さらに、符号54に図示したスピーカを有する適当なオーディオシステムにも接続されている。”(自然语言对话模块连接到文本-语音合成器52,该合成器52从文本合成语音,并进一步连接到具有如图标54所示的扬声器的适当音频系统。)(参见说明书第【0026】段)。 系统可以向用户提问或确认信息,例如在确定晚餐菜单时,系统会“提案すると共に、摂取する必要がある成分についてユーザの注意を喚起する”(提出建议,并提醒用户需要注意摄取的成分)(参见说明书第【0011】段)。 | 对比文件明确公开了系统具备文本-语音合成器52和扬声器54(输出变换器),用于向用户输出语音信号。说明书第【0011】段的示例表明,系统会向用户语音输出信息(如晚餐建议),这些信息是基于对电器(冰箱)能力(存储物品)的分析得出的。因此,“利用输出变换器来输出指示所述电器的所述能力的语音信号”这一特征被对比文件直接公开。 |
| **K**:还包括由所述计算机服务器基于所述控制设置来控制所述电器的所述能力。《直接公开》 | “自然言語対話モジュールは、ユーザの入力音声の意味内容(semantic content)すなわち意味(meaning)を確かめ、ネットワーク 10を介して通信している、対応する装置に適切な命令を与える。”(自然语言对话模块确认用户输入语音的语义内容即含义,并向通过网络10通信的对应设备发出适当的指令。)(参见说明书第【0026】段)。 | 对比文件明确记载了系统(自然语言对话模块)在理解用户意图(即确定了控制设置)后,会向对应的设备发出命令。发出命令即是对电器进行控制的行为。因此,“基于控制设置来控制所述电器的所述能力”这一特征被对比文件直接公开。 |
| **L**:还包括由所述计算机服务器基于所述音频信号来生成针对所述电器的网络标识符。《隐含公开》 | 系统中,不同的设备(如冰箱、电视)有对应的电子作业指南(EAG)(参见说明书第【0025】段)。用户通过语音引用特定设备(如对冰箱说话),系统需要识别出用户指的是哪个设备。虽然没有明确说明生成“网络标识符”,但系统必须能够将语音中提及的设备名称或描述映射到网络中的具体设备地址或标识。这个过程隐含了基于音频信号(识别出的设备名称)来关联或生成用于网络寻址的标识符。 | 在对比文件描述的网络化语音控制系统中,用户通过自然语言指代设备(如“冰箱”)。系统需要将这种指代解析并映射到网络中特定的设备实体,这必然涉及使用或生成某种形式的设备标识符(例如,将“冰箱”映射到其网络地址或内部ID)。虽然对比文件未明确描述“生成网络标识符”的步骤,但这是实现语音控制网络设备的必要隐含步骤。因此,该特征被隐含公开。 |
| **M**:还包括由所述计算机服务器基于所述音频信号来识别所述用户的语音模式,并且至少部分地基于所述语音模式来认证所述用户。《直接公开》 | “特定のユーザのための特性データは、話者の検証あるいは鑑定を用いて選択されてもよい。 この点に関して、認識システムは、各ユーザにおける、特有の、もしくは識別している音声特性を記憶する。 それ以降、そのユーザが入力音声を供給すると、システムは、音声特性に基づく話者鑑定を行うことによって、話者を識別するか、あるいは、スピーチ特性に基づく話者検証を行うことによって、話者から提供された身元を証明することができる。”(特定用户的特征数据可以通过说话者验证或鉴定来选择。在这方面,识别系统存储每个用户特有的或可识别的语音特征。之后,当该用户提供输入语音时,系统可以通过基于语音特征的说话者鉴定来识别说话者,或者通过基于语音特征的说话者验证来证明说话者提供的身份。)(参见说明书第【0033】段)。 | 对比文件明确公开了系统可以存储用户的语音特征(语音模式),并在用户提供语音输入时,基于这些语音特征进行说话者鉴定或验证,从而识别或认证用户身份。这直接对应于目标专利中“基于音频信号识别用户语音模式并基于语音模式认证用户”的技术特征。 |
| **N**:其中,接收所述指示所述能力的信息包括以下各项中的至少一项:(a)与远程服务器进行通信以从存储在所述服务器上的数据库取出所述信息《隐含公开》 | “また、自然言語対話モジュールは、ネットワークを介して通信している装置に、制御命令及びメニュー移動命令を与えることができる。 このように、本発明は、情報を入手し、かつ家庭の至る所の装置、器具、コンピュータ、及びその他のシステムを制御する、自然発音モードをユーザに提供する。”(此外,自然语言对话模块可以向通过网络通信的设备提供控制命令和菜单导航命令。这样,本发明为用户提供了一种自然发音模式,以获取信息并控制家庭各处的设备、器具、计算机和其他系统。)(参见说明书第【0010】段)。 系统可以访问互联网(参见说明书第【0009】、【0012】段)。 | 对比文件公开了系统可以控制家庭各处的设备,并且系统可以连接到互联网。虽然未明确说明从远程服务器数据库获取设备能力信息,但本领域技术人员可以合理推断,在一个连接互联网的智能家居系统中,设备的能力信息(如新型号电器的功能)有可能存储在远程服务器上供系统查询。这是一种可能的实现方式。因此,该特征被对比文件隐含公开。 |
| **O**:或者(b)经由所述网络从所述电器接收所述信息。《隐含公开》 | “できれば、ネットワーク 10 に接続される各装置は、図1における符号16〜24で示された装置のように、独立した処理能力と、少なくとも、いくらかの限られたデータ記憶能力とを持っているとよい。”(优选地,连接到网络10的每个设备,如图1中标号16~24所示的设备,最好具有独立的处理能力和至少一些有限的数据存储能力。)(参见说明书第【0021】段)。 每个设备有对应的电子作业指南(EAG)(参见说明书第【0025】段)。 | 对比文件公开了网络中的设备具有数据存储能力,并且每个设备有对应的电子作业指南(EAG)。虽然EAG可能存储在系统30中,但设备自身存储其能力信息并通过网络提供给系统也是一种合理且常见的实现方式。说明书强调了设备的独立性和数据存储能力,这为设备直接提供信息提供了基础。因此,该特征被对比文件隐含公开。 |
| **P**:其中,所述计算机服务器包括家庭自动化系统的集中式控制器。《隐含公开》 | 图1示出系统30(语音识别和自然语言处理系统)连接到网络10,为网络中的各种设备提供集中式的语音识别和自然语言处理服务(参见说明书第【0022】段)。 系统30可以“ホームゲートウェイ12 の中に組み込まれていてもよい”(可以被内置在家庭网关12中)(参见说明书第【0022】段),而网关12可以包含各种家庭自动化功能(参见说明书第【0020】段)。 | 对比文件中的系统30作为一个核心处理系统,为整个家庭网络提供语音控制服务,其功能类似于一个集中式控制器。此外,它还可以被集成到家庭网关12中,而网关12本身可能就是一个集中式控制器。因此,对比文件隐含公开了计算机服务器可以是家庭自动化系统的集中式控制器。 |
| **Q**:其中,所述计算机服务器包括家庭自动化系统的多个分布式控制器中的一个。《隐含公开》 | “システム 30 は、物理的には、ホームゲートウェイ12 の中に組み込まれていてもよいし、ネットワークを介して通信する他の装置、器具、コンピュータ、オートメーションシステム、及び、他のシステムのうちのいずれかの中に組み込まれていてもよい。”(系统30在物理上,可以内置在家庭网关12中,也可以内置在通过网络通信的其他设备、器具、计算机、自动化系统和其他系统中的任何一个中。)(参见说明书第【0022】段)。 | 对比文件明确指出,系统30的功能(即作为计算机服务器)可以物理上集成到网络中的其他设备(如器具、计算机、自动化系统)中。这意味着语音控制服务器可以分布在不同的网络设备上,而不是必须集中在一处。因此,该特征被对比文件隐含公开。 |
<<<C>>><<<D>>><<<H>>><<<J>>><<<K>>><<<M>>>
<<<a>>><<<b>>><<<e>>><<<f>>><<<g>>><<<i>>><<<l>>><<<n>>><<<o>>><<<p>>><<<q>>>