新闻中心
-
05-23从Claude 3中提取数百万特征,首次详细理解大模型的「思维」刚刚,Anthropic宣布在理解人工智能模型内部运作机制方面取得重大进展。Anthropic已经确认了如何在ClaudeSonnet中表示征函数百万个概念。这...
-
11-24新标题:Meta改进Transformer架构:强化推理能力的新注意力机制大型语言模型(LLM)的强大已经是不容置疑的事实,然而它们有时仍然会犯一些简单的错误,显示出推理能力较弱的一面举个例子,LLM可能会因为不相关的上下文或者输入提...
-
10-24RLHF模型普遍存在「阿谀奉承」,从Claude到GPT-4无一幸免不管你是身处AI圈还是其他领域,或多或少的都用过大语言模型(LLM),当大家都在赞叹LLM带来的各种变革时,大模型的一些短板逐渐暴露出来。例如,前段时间,Goo...
-
共1页 3条

