新闻中心
-
08-18给RAG系统做一次全面「体检」,亚马逊开源RAGChecker诊断工具AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-14OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?有人说,「我们期待的是草莓,但他们发布的是羽衣甘蓝。」我们来看看这个「羽衣甘蓝」是做什么用的。一直以来,大模型的编程能力都备受关注,超强AI程序员Devin的问...
-
08-10Karpathy观点惹争议:RLHF不是真正的强化学习,谷歌、Meta下场反对RLHF与RL到底能不能归属为一类,看来大家还是有不一样的看法。AI大牛Karpathy又来科普人工智能概念了。昨日,他发推表示,「基于人类反馈的强化学习(RL...
-
08-09吴恩达亲自授课,LLM当「助教」,适合初学者的Python编程课程上线吴恩达教授开新课了,还是亲自授课!今天,人工智能著名学者、斯坦福大学教授吴恩达在社交平台X上发帖介绍了一门新课程——AIPythonforBeginners,旨...
-
08-05延迟交互模型,为什么是下一代RAG的标配?AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-05能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径文本大模型卷出新高度,Claude3在数学、编程、多语言理解、视觉等多个维度超越GPT-4和上线不足一个月的Gemini1.0Ultra。「日新月异」已经不足以...

