目标专利:633选择性地组合多个视频馈送以用于群通信会话
专利公开号:CN104272730B
专利权人:高通股份有限公司
无效请求书提交日期:2026年
非显而易见性评估仅供参考,不构成法律建议。
| 编号 | 名称 |
|---|
一种用于在通信设备(170;200;400)处选择性地组合视频数据的方法,包括:从多个视频捕捉设备接收(615A;620A;625A;600D;600E;605E;610E;920,925,930)多个视频输入馈送,所接收到的多个视频输入馈送中的每一个视频输入馈送提供给定的感兴趣的视觉主题的不同透视,其中所述多个视频输入馈送中的至少一个视频输入馈送是接收自单个视频捕捉设备的单个视频输入馈送,所述单个视频捕捉设备是在处于对等通信会话中的具有所述给定的感兴趣的视觉主题的相似透视的视频捕捉设备之中选择的,其中所述单个视频捕捉设备是基于在处于对等通信会话中的具有所述给定的感兴趣的视觉主题的相似透视的所述视频捕捉设备之中具有较高带宽来选择的; 针对所接收到的多个视频输入馈送中的每一个视频输入馈送,接收(615A;620A;625A; 600D;600E;605E;610E;920,925,930)对(i)相关联的视频捕捉设备的位置、(ii)所述相关联的视频捕捉设备的朝向以及(iii)所接收到的视频输入馈送的格式的指示; 基于所述多个视频捕捉设备中的每一者的位置和朝向来选择(630A;605D;630E;820A; 820B;820C;935)所接收到的多个视频输入馈送的非冗余集合; 将选定的视频输入馈送交织(635A;600B;605B;600C;605C;610D;620E;625E;630E; 830A;835B;830C;90)成符合目标格式的视频输出馈送;以及将所述视频输出馈送传送(640A;615D;635E;640E;645E;945)给目标视频呈现设备集合。
如权利要求1所述的方法,其特征在于, 所述选定的视频输入馈送各自是二维(2D)的, 其中所述目标格式对应于通过交织所述选定的视频输入馈送的各部分所形成的所述给定的感兴趣的视觉主题的三维(3D)视图。
如权利要求1所述的方法,其特征在于,所述目标格式对应于通过交织所述选定的视频输入馈送的非交迭部分所形成的所述给定的感兴趣的视觉主题的全景图。
如权利要求1所述的方法,其特征在于, 所述目标格式对应于针对所述视频输出馈送的聚集大小格式,所述方法进一步包括:压缩所述选定的视频输入馈送中的一个或多个视频输入馈送,以使得所述视频输出馈送在所述交织之后达成所述聚集大小格式。
如权利要求1所述的方法,其特征在于,所述通信设备对应于远离所述多个视频捕捉设备和所述目标视频呈现设备集合的服务器。
如权利要求1所述的方法,其特征在于, 所述多个视频捕捉设备和所述目标视频呈现设备集合各自对应于参与本地群通信会话的用户装备UE,并且其中所述通信设备对应于也参与所述群通信会话的给定UE。
如权利要求1所述的方法,其特征在于,进一步包括: 选择所接收到的多个视频输入馈送的不同集合; 将所述选定的不同视频输入馈送交织成符合给定的目标格式的不同视频输出馈送;以及将所述不同的视频输出馈送传送给目标视频呈现设备的不同集合。
如权利要求1所述的方法,其特征在于,进一步包括: 选择所接收到的多个视频输入馈送的给定集合; 将所述选定的给定视频输入馈送交织成符合不同的目标格式的不同视频输出馈送;以及将所述不同的视频输出馈送传送给目标视频呈现设备的不同集合。
如权利要求1所述的方法,其特征在于,所接收到的对位置的指示包括(i)所述多个视频捕捉设备中的至少一个视频捕捉设备的绝对位置的指示,和/或(ii)所述多个视频捕捉设备中的两个或更多个视频捕捉设备之间的相对位置的指示。
如权利要求1所述的方法,其特征在于,进一步包括: 以基于事件的方式来同步所述选定的视频输入馈送, 其中所述交织是针对经同步的视频输入馈送来执行的。
如权利要求10所述的方法,其特征在于,所述同步包括:标识所述选定的视频输入馈送内的共同跟踪对象集合; 检测与所述共同跟踪对象集合相关联的在所述选定的视频输入馈送中的每一个视频输入馈送中可见的事件;以及基于检测到的事件来同步所述选定的视频输入馈送。
如权利要求1所述的方法,其特征在于,所述选择包括:将所接收到的多个视频输入馈送中的每一个视频输入馈送表征为(i)针对所述目标格式关于所接收到的多个视频输入馈送中的至少一个其它视频输入馈送冗余,或者(ii)不冗余; 通过(i)包括来自所接收到的多个视频输入馈送的被表征为非冗余的的一个或多个视频输入馈送,和/或(ii)包括关于来自所接收到的多个视频输入馈送中的被表征为冗余的每一个视频输入馈送集合的单个代表性视频输入馈送来形成非冗余视频输入馈送集合,其中所述选定的视频输入馈送对应于所述非冗余视频输入馈送集合。
一种配置成选择性地组合视频数据的通信设备(170;200;400),包括:配置成从多个视频捕捉设备接收(615A;620A;625A;600D;600E;605E;610E;920,925, 930)多个视频输入馈送的逻辑(405),所接收到的多个视频输入馈送中的每一个视频输入馈送提供给定的感兴趣的视觉主题的不同透视,其中所述多个视频输入馈送中的至少一个视频输入馈送是接收自单个视频捕捉设备的单个视频输入馈送,所述单个视频捕捉设备是在处于对等通信会话中的具有所述给定的感兴趣的视觉主题的相似透视的视频捕捉设备之中选择的,其中所述单个视频捕捉设备是基于在处于对等通信会话中的具有所述给定的感兴趣的视觉主题的相似透视的所述视频捕捉设备之中具有较高带宽来选择的; 配置成针对所接收到的多个视频输入馈送中的每一个视频输入馈送,接收(615A; 620A;625A;600D;600E;605E;610E;920,925,930)对(i)相关联的视频捕捉设备的位置、(ii)所述相关联的视频捕捉设备的朝向以及(iii)所接收到的视频输入馈送的格式的指示的逻辑(405); 配置成基于所述多个视频捕捉设备中的每一者的位置和朝向来选择(630A;605D; 630E;820A;820B;820C;935)所接收到的多个视频输入馈送的非冗余集合的逻辑(410); 配置成将选定的视频输入馈送交织(635A;600B;605B;600C;605C;610D;620E;625E; 630E;830A;835B;830C;90)成符合目标格式的视频输出馈送的逻辑(410);以及配置成将所述视频输出馈送传送(640A;615D;635E;640E;645E;945)给目标视频呈现设备集合的逻辑(405)。
一种包括用于执行根据权利要求1到12中任一项所述的方法的装置的设备(170; 200;400)。