金融界2024年6月21日音讯,天眼查常识产权信息数据显现,腾讯科技(深圳)有限公司请求一项名为“编码器处理办法、文本处理办法及相关设备“,揭露号CN2.9,请求日期为2024年5月。
专利摘要显现,本请求揭露编码器处理办法、文本处理办法及相关设备,编码器处理办法有:获取榜首编码器和第二编码器,榜首编码器的编码准确性低于第二编码器的编码准确性,榜首编码器的编码功率高于第二编码器的编码功率;获取多个样本调集,每个样本调集包含基准文本和基准文本对应的负样本文本;不同的样本调集中的负样本文本具有不一样的学习难度;确认每个样本调集的学习次序,任一样本调集的学习次序与相应样本调集中的负样本文本的学习难度成正相关;依照学习次序从低到高的次序,操控榜首编码器依据多个样本调集和第二编码器进行多轮常识蒸馏学习,以得到一起具有编码准确性和编码功率的方针编码器,然后提高文本类似度的编码作用。