新闻中心
-
05-07用于时间序列概率预测的分位数回归不要改变原内容的意思,微调内容,重写内容,不要续写。“分位数回归满足这一需求,提供具有量化机会的预测区间。它是一种统计技术,用于模拟预测变量与响应变量之间的关系...
-
05-07硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎Sora发布后出现了一些bug,网络上的用户发现了一些问题,尽管模型对物理世界的了解并不充分,但小狗在行走时,两条前腿就会出现交错问题,让人意外地出现游戏。关于...
-
05-07全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源MoE模型来了。...
-
05-07爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP多层感知器(MLP),也被称为全连接前馈神经网络,是如今深度学习模型的基础构建块。MLP的重要性无论如何强调都不为过,因为它们是机器学习中用于逼近非线性函数的默...
-
05-06看透物体的3D表示和生成模型:NUS团队提出X-Ray项目主页:https://tau-yihouxiang.github.io/projects/X-Ray/X-Ray.html论文地址:https://arxi...
-
05-0658行代码把Llama 3扩展到100万上下文,任何微调版都适用堂堂开源之王Llama3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。在32k起步,100k寻常的今天,这是故意要给开源社区留做贡献的空间...

