新闻中心
-
08-06LangExtract— 谷歌开源的结构化信息提取工具LangExtract是什么LangExtract是由谷歌推出的一个开源Python库,旨在从非结构化文本中高效提取结构化信息。该工具依托大型语言模型(LLM)...
-
08-03如何配置夸克AI大模型适配自有数据源 夸克AI大模型定制知识上传方式要让夸克AI大模型有效利用私有数据,核心在于构建基于RAG的“知识检索与注入”机制。1.数据预处理需清洗与标准化,统一格式、剔除噪声,确保数据质量;2.内容切分...
-
08-03如何使用Claude进行长文本处理 Claude长文本处理技巧分享要让Claude高效处理长文本,需掌握四个关键方法。一、合理分段输入,避免信息过载,建议每500-1000字一段并配合明确指令;二、善用提示词引导输出结构,如“...
-
07-30飞桨常规赛:中文新闻文本标题分类-9月第四名方案该方案针对中文新闻标题14分类任务,基于PaddleNLP,采用RoBERTa等预训练模型微调。分析THUCNews数据集,用AEDA、EDA做数据增强,处理数...
-
07-29『NLP打卡营学习笔记』实践课2:文本语义相似度计算本文介绍基于ERNIE-Gram模型实现语义匹配的案例。以LCQMC数据集为例,说明文本语义匹配任务,即判断两段文本语义是否相似。还讲解了数据加载、预处理、模型...
-
07-29柠檬分类竞赛:飞桨图像分类套件PaddleClas竞赛实战本文介绍飞桨图像分类套件PaddleClas竞赛实战方法,包括模型库概览,其提供服务器端和端侧模型;还讲解了竞赛实战的前置条件、数据集准备、模型训练评估、数据增...

