**对比文件名称:** 2003-11-25_US6654720B_发明授权_US06654720B1 Method and system for voice control enabling device in a service discovery network
**目标专利名称:** 282自动化系统的语音控制配置CN104823411B
**本次调用模型名称:** 深度分析对比文件公开性模型
**特征比对表格**
| 技术特征描述以及公开性判断结果 | 对比文件原文引用 | 公开性论述 |
| **技术特征A《直接公开》**<br>所述方法包括:由计算机服务器来检测经由计算机网络与所述计算机服务器进行通信的所述电器。 | “This invention allows control of devices through voice commands where the command and control hardware and software are shared amongst the individual devices. The service discovery mechanism locates each device. ... when a device is plugged in, it can be automatically connected to the network through some protocol, such as Sun Microsystems' Jini.” (说明书第2页第4-5段)<br>“When the toaster detects it has been connected to a service discovery network, it immediately begins participating in the service discovery protocol by sending out signals for registration. A discovery protocol causes the toaster to be registered with the Service Discovery Protocol Registry (action 604).” (说明书第7页第1段, 对应图6动作604) | 对比文件明确公开了设备(如烤面包机)通过服务发现协议(如Jini)连接到网络并进行注册。其“Service Discovery Protocol Registry”或“control logic 406”即相当于目标专利中的“计算机服务器”,其功能包括检测网络中注册的设备。该特征在对比文件中的作用是使系统能够发现并识别新加入网络的设备,与目标专利中服务器检测新通信的电器的目的和作用完全相同。本领域技术人员能够毫无疑义地得出该技术方案。 |
| **技术特征B《直接公开》**<br>由所述计算机服务器来接收指示所述电器的能力的信息。 | “At the time of registration, a device sends a grammar and a set of help sequences to a control unit in the zone to be merged into a composite grammar and composite set of help sequences.” (说明书摘要, 第1页倒数第2段)<br>“Since the toaster's registration contains the grammar sequences of recognized words, this information is installed with the speech recognition module at the time of registration (step 606). There may also be help commands and control scripts which are, registered with the speech generation unit (step 608).” (说明书第7页第1段, 对应图6动作606, 608) | 对比文件明确公开了设备(如烤面包机)在注册时,会向区域中的控制单元(control unit)发送其“语法(grammar)”和“帮助序列(help sequences)”。这些“语法”定义了设备能够响应的语音命令词汇(如图5所示),实质上就是指示了该设备可以通过语音控制哪些“能力”(例如,“pop up”、“increase temperature”)。这与目标专利中服务器接收指示电器能力的信息(如控制状态、可执行操作)在技术方案和作用上一致,都是为了告知控制器设备有哪些可控功能。 |
| **技术特征C《直接公开》**<br>由所述计算机服务器来接收来自用户的、由电声变换器转换为音频信号的音频输入。 | “The human then speaks the command ‘toaster begin’ (action 610). The analog signal at the microphone is converted to a digital signal and sent to the speech recognition system (action 612).” (说明书第7页第1段, 对应图6动作610, 612)<br>“Microphone 408, speech recognition system 410” (说明书第5页第2段, 对应图4) | 对比文件明确描述了用户发出语音命令,麦克风(电声变换器)接收并将其转换为模拟信号,然后转换为数字信号发送给语音识别系统。该语音识别系统是共享的控制逻辑(如图4中的控制逻辑406、语音识别系统410)的一部分,相当于目标专利中计算机服务器的功能组件。该技术特征被直接公开,作用均为接收用户语音输入以供后续处理。 |
| **技术特征D《直接公开》**<br>由所述计算机服务器通过将所述音频信号处理为数字文本数据来确定用于所述电器的配置信息。 | “This analog signal is digitized (action 624) and all three words are recognized by the speech recognition system (action 626).” (说明书第7页第2段, 对应图6动作624, 626)<br>“The speech recognition system identifies the device ‘toaster’ but fails to recognize the operation ‘begin’ (action 614).” (说明书第7页第1段, 对应图6动作614)<br>“FIG. 5 shows a subset of commands recognized by the system controlling the toaster... Associated with each recognized command sequence is a Java method that can be invoked to cause the device to function as commanded.” (说明书第5页第3段) | 对比文件公开了语音识别系统对数字化的音频信号进行处理,识别出其中的单词(如“toaster”、“pop down”),这本身就是将音频信号处理为文本或命令序列数据的过程。进一步地,识别出的命令序列会映射到具体的设备方法调用(如图5),从而确定了控制该设备的“配置信息”(即,要执行哪个方法)。该过程由共享的控制逻辑/语音识别系统执行,相当于目标专利中计算机服务器的功能。因此,该技术特征被直接公开。 |
| **技术特征E《直接公开》**<br>其中,所述配置信息包括用于控制所述电器的所述能力的控制设置。 | “For example, the command sequence generated by ‘toaster pop up’ results in the command and control software, working with the service discovery register, invoking the method ‘popUp( )’. ... Each voice enabled device in a network would need appropriate means to carry out the operations specified by voice commands.” (说明书第5页第3-4段)<br>“This caused the ‘popDown( )’ method invocation to be sent to the toaster (action 628).” (说明书第7页第2段, 对应图6动作628) | 对比文件明确公开了,通过语音识别确定的命令(配置信息),其具体内容就是用于控制设备能力的“控制设置”。例如,识别出“toaster pop down”后,确定的控制设置就是调用“popDown()”方法,这个方法指令就是控制烤面包机下降并开始加热的“控制设置”。这与目标专利中配置信息包括控制设置的技术方案和作用完全相同。 |
| **技术特征F《直接公开》**<br>其中,所述控制设置包括以下各项中的至少一项:与所述电器被上电或者断电的一个或多个时间相对应的调度。 | “The human user says ‘microwave’ and then pauses. ... The remaining dialog ... ‘microwave defrost later five fifteen PM three point two pounds.’” (说明书第8页第1段, 对应图7及描述)<br>“For example, as shown in FIG. 5, the grammar sequences ... have been registered.” (说明书第8页第2段) | 对比文件在图7的示例对话中,用户给出了“microwave defrost **later five fifteen PM** ...”这样的命令。其中“later five fifteen PM”明确指示了在未来的一个特定时间(下午5点15分)执行“解冻”操作。这公开了控制设置可以包括与电器执行操作(可广义理解为一种上电或激活状态)的时间相对应的“调度(schedule)”。虽然对比文件示例是微波炉解冻,但本领域技术人员能直接且毫无疑义地理解,对于电源开关类电器,同样可以通过语音设置类似“灯在7点打开”的调度命令。作用均为通过语音设置定时任务。 |
| **技术特征G《直接公开》**<br>将所述电器的配置推迟至稍后的时间的设置。 | 同上(技术特征F的引用)。用户命令“microwave defrost **later** five fifteen PM ...”,其中的“later”一词即表示将“解冻”这一操作(属于对微波炉的一种配置)推迟到稍后的指定时间。系统支持并识别这样的命令,意味着“推迟至稍后时间”本身就是一种可被设置的控制选项或配置状态。这与目标专利中“推迟配置”的技术方案直接对应,作用相同。 | |
| **技术特征H《直接公开》**<br>或者当所述电器被上电时要由其执行的一个或多个操作。 | “For example, the command sequence generated by ‘toaster pop up’ results in ... invoking the method ‘popUp( )’. This method invocation is sent to the device and the device must be capable of carrying out the appropriate operation...” (说明书第5页第3段)<br>“Each voice enabled device in a network would need appropriate means to carry out the operations specified by voice commands.” (说明书第5页第4段) | 对比文件的核心就是通过语音命令控制设备执行具体操作。如图5和动作628所示,识别出的命令(如“toaster pop down”)直接对应设备要执行的具体操作(调用popDown()方法使面包片下降并加热)。这些操作就是在设备被“激活”(上电以执行任务)时要执行的动作。该技术特征被直接公开,作用完全一致。 |
| **技术特征I《直接公开》**<br>根据所确定的配置信息来利用所述计算机服务器配置所述电器。 | “This caused the ‘popDown( )’ method invocation to be sent to the toaster (action 628).” (说明书第7页第2段, 对应图6动作628)<br>“The voice recognition and generation is performed in conjunction with a service discovery network. The service discovery provides the dynamics of devices entering and leaving the network, which, in turn, provides the events and data to update the command and control grammar for devices in a given zone.” (说明书第4页第3段) | 对比文件公开了在语音命令被识别后,控制逻辑(计算机服务器的功能体现)会将对应的方法调用(即配置信息/控制设置)发送给设备(动作628),设备据此执行操作。此外,设备注册时发送的语法信息被合并到复合语法中(动作606),这也是系统根据设备提供的信息对其控制命令集进行“配置”的过程。因此,对比文件公开了服务器根据确定的信息(语法或方法调用)来配置(更新系统命令集或指令设备)电器的技术方案。 |
| **技术特征J《直接公开》**<br>以及利用输出变换器来输出指示所述电器的所述能力的语音信号。 | “Voice generation is used to provide assistance to the user in the event a command is not recognized or to guide the user in the use of the system.” (说明书第4页第3段)<br>“If the device in the voice command is recognized but the operation is not recognized, then the user is provided with a help sequence on how to properly perform operations with the device.” (说明书摘要, 第1页倒数第1段)<br>“speech generation system 412, and speaker 414.” (说明书第5页第2段, 对应图4)<br>“...a help routine for the object toaster is sent to the speech generation system (action 616). This message is converted from digital to analog and sent to the speaker (action 618).” (说明书第7页第1段, 对应图6动作616, 618) | 对比文件明确且多次描述了利用语音生成系统和扬声器(输出变换器)向用户输出语音信号,特别是在命令未识别或用户需要指导时,提供帮助序列。这些帮助序列的内容包含了设备能够执行哪些操作(即其能力)的指引。例如,在用户说“toaster help”时,系统可以生成如“Please select one of the following operations—pop, increase, or decrease.”的语音提示,这直接“指示了所述电器的所述能力”。该特征被直接公开,作用相同。 |
| **技术特征K《直接公开》**<br>还包括由所述计算机服务器基于所述控制设置来控制所述电器的所述能力。 | “This caused the ‘popDown( )’ method invocation to be sent to the toaster (action 628).” (说明书第7页第2段, 对应图6动作628)<br>“If the voice command issued by a user is recognized, an appropriate method invocation is sent to the device to perform the desired operation.” (说明书摘要, 第1页倒数第2段) | 对比文件的核心控制流程就是:识别语音命令 -> 确定对应的方法调用(控制设置) -> 将该调用发送给设备执行。发送方法调用(如popDown())这一动作,就是“基于控制设置来控制电器能力”的直接体现。该技术特征被明确公开,作用完全一致。 |
| **技术特征L《隐含公开》**<br>还包括由所述计算机服务器基于所述音频信号来生成针对所述电器的网络标识符。 | “The speech recognition system identifies the device ‘toaster’...” (说明书第7页第1段, 对应图6动作614)<br>“At the time of registration, a device sends a grammar and a set of help sequences to a control unit...” (说明书摘要, 第1页倒数第2段) | 对比文件公开了语音识别系统可以从音频信号中识别出设备名称(如“toaster”)。虽然对比文件主要使用设备注册时提供的内部标识进行关联,但本领域技术人员可以合理推断,系统可以将从用户语音中识别出的设备名称(如用户习惯称呼的“厨房顶灯”)作为一种“网络标识符”或别名,与设备在服务发现协议中的正式网络地址(如IP、UUID)进行关联和存储,以便后续通过该名称进行控制和寻址。这是一种隐含的、逻辑上必然存在的映射关系。因此,该特征被隐含公开。 |
| **技术特征M《隐含公开》**<br>还包括由所述计算机服务器基于所述音频信号来识别所述用户的语音模式,并且至少部分地基于所述语音模式来认证所述用户。 | “This invention can also be used with systems that provide training to recognize voice commands from individual users in order to increase the accuracy of the voice recognition system. This may be desirable in a home environment where the same residents will be using the system continually on a long term basis.” (说明书第6页第1段) | 对比文件提到了系统可以“训练以识别个别用户的语音命令”,以提高准确性。训练系统识别特定用户语音的过程,必然涉及提取和存储该用户的“语音模式”(如声纹特征)。虽然对比文件未明确将“语音模式”用于“认证”(身份验证),但提高对特定用户命令的识别准确性,本身就隐含了系统能够区分不同用户。在本领域,利用已存储的特定用户语音模式来验证当前说话者是否为合法用户,是语音交互系统中一种常见且合理的扩展应用。因此,该技术特征被对比文件隐含公开。 |
| **技术特征N《直接公开及隐含公开》**<br>其中,接收所述指示所述能力的信息包括以下各项中的至少一项:(a)与远程服务器进行通信以从存储在所述服务器上的数据库取出所述信息。 | 未明确描述从远程服务器数据库获取能力信息。 | 对比文件明确描述了设备在注册时“直接”向控制单元发送语法和帮助序列(参见技术特征B的引用),这对应于选项(b)。对于选项(a),对比文件没有直接记载。然而,在本领域,设备能力信息既可以存储在设备本地,也可以存储在远程数据库中通过型号等标识符查询,这是两种等效且常见的技术手段。对比文件已经公开了接收能力信息这一上位概念,且公开了实现方式(b)。本领域技术人员根据实际需要(如设备存储空间有限),很容易想到采用方式(a)作为替代方案来获取相同的能力信息。因此,选项(a)被对比文件隐含公开。 |
| **技术特征O《直接公开》**<br>其中,接收所述指示所述能力的信息包括以下各项中的至少一项:...(b)经由所述网络从所述电器接收所述信息。 | “At the time of registration, a device sends a grammar and a set of help sequences to a control unit in the zone...” (说明书摘要, 第1页倒数第2段)<br>“When the toaster detects it has been connected to a service discovery network, it immediately begins participating in the service discovery protocol by sending out signals for registration.” (说明书第7页第1段, 对应图6动作604) | 此特征与技术特征B的引用和论述一致。对比文件明确公开了设备在注册时,通过网络(如电力线通信)直接向区域内的控制单元(计算机服务器)发送其语法和帮助序列(即能力信息)。这是选项(b)的直接体现。 |
| **技术特征P《隐含公开》**<br>其中,所述计算机服务器包括家庭自动化系统的集中式控制器。 | “The zones from FIG. 1 become nodes in the house network. ... These zones are interconnected and for some devices, such as the security system, may have a central control, such as control center 225 shown.” (说明书第3页第2段, 对应图2及描述)<br>“This federated network could either be organized into a ring of zones with information being passed around the ring or it could be organized in a hierarchy with a central control at the house level.” (说明书第9页第2段) | 对比文件描述了分区(zone)控制系统,每个分区有自己的本地网络和控制逻辑。但同时,它也提及对于一些设备(如安全系统)可能有一个“中央控制(central control)”,并且整个联邦网络可以组织成具有“房子级别的中央控制”的层次结构。这公开了系统中可以存在集中式控制器的架构可能性。虽然其实施例侧重于分布式分区控制,但“中央控制”的明确提及使得本领域技术人员能够合理推断出系统可以包含集中式控制器作为其一种实现方式。因此,该特征被隐含公开。 |
| **技术特征Q《直接公开》**<br>其中,所述计算机服务器包括家庭自动化系统的多个分布式控制器中的一个。 | “Each zone has its own local service discovery network... The zones from FIG. 1 become nodes in the house network. Zones 1-5 correspond to nodes 202, 204, 206, 208, and 210, respectively. Each device or appliance is connected to one of these nodes.” (说明书第3页第1-2段, 对应图2)<br>“With reference now to FIG. 4, a diagram shows the connection of a toaster to the local network in the kitchen. ... The local network in the kitchen contains control logic 406...” (说明书第5页第1-2段, 对应图4) | 对比文件的核心架构就是基于分区的分布式控制系统。每个区域(如厨房)都有一个本地的服务发现网络,并包含“控制逻辑(control logic 406)”。这些分布在各个区域的控制逻辑,共同协作构成整个家庭自动化系统的控制功能,它们就是“多个分布式控制器”。图2中的各个节点(202, 204等)也可以视为分布式控制点。因此,目标专利中“计算机服务器包括...多个分布式控制器中的一个”这一特征,被对比文件直接且明确地公开。 |
<<<A>>><<<B>>><<<C>>><<<D>>><<<E>>><<<F>>><<<G>>><<<H>>><<<I>>><<<J>>><<<K>>><<<O>>><<<Q>>><<<l>>><<<m>>><<<n>>><<<p>>>