文档处理 | 萝卜智能

亮相CCIG 合合信息破解大模型语料“饥荒”难题

大模型技术正随着科技革新实现广泛应用，满足多行业图像处理需求。但大模型一路“高歌猛进”的背后，隐藏着一场关于模型训练语料的“能源危机”。根据人工智能研究人员小组Epoch研究估计，机器学习数据集可能会在2026年前耗尽所有“高质量语言数据”。现阶段，大量的高质量语料数据存在于书籍、论文、研报、企业文档等文档之中，复杂的版面结构制约了大模型的训练语料处理及大模型文档问答的应用能力。文档解析技术的进步，让机器能够识别文档中的多种元素，更好地处理文本、表格、图像等多类型数据，还原文档阅读顺序，加速大…

ai导航 2024年6月20日
智东西：马斯克向OpenAI首席科学家抛橄榄枝；北大微信AI团队获EMNLP最佳长论文奖；欧盟通过AI监管临时协议丨AIGC大事-aigc导航|ai导航

1、智谱AI发布文本质量评价模型CritiqueLLM 据GLM大模型微信公众号今日发文，智谱AI近日提出了可解释、可扩展的文本质量评价模型CritiqueLLM，该模型可以针对各类指令遵循任务上大模型的生成结果提供高质量的评价分数和评价解释。评价结果显示，在各项任务上660亿参数的CritiqueLLM与人工评分的相关系数均超过ChatGPT，达到和GPT-4相当的水平。尤其是在具有挑战性的无参考文本设定下，CritiqueLLM能够在3项任务（包括综合问答、文本写作和中文理解）上超过GPT-…

ai导航 2024年6月19日

亮相CCIG 合合信息破解大模型语料“饥荒”难题

智东西：马斯克向OpenAI首席科学家抛橄榄枝；北大微信AI团队获EMNLP最佳长论文奖；欧盟通过AI监管临时协议丨AIGC大事-aigc导航|ai导航

联系我们

微信747975991