新闻中心
-
03-06Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?StabilityAI在发布了StableDiffusion3之后,今天公布了详细的技术报告。论文深入分析了StableDiffusion3的核心技术——改进版...
-
02-04像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍现有的大模型对齐方法包括基于示例的监督微调(SFT)和基于分数反馈的强化学习(RLHF)。然而,分数只能反应当前回复的好坏程度,并不能明确指出模型的不足之处。相...
-
10-27RLHF与AlphaGo核心技术强强联合,UW/Meta让文本生成能力再上新台阶在一项最新的研究中,来自UW和Meta的研究者提出了一种新的解码算法,将AlphaGo采用的蒙特卡洛树搜索算法(Monte-CarloTreeSearch,MC...
-
10-03多模态版Llama2上线,Meta发布AnyMAL在多个基准测试中均刷新了业界最好的zero-shot性能。一个统一的模型,可以对不同模态输入内容(文本、图像、视频、音频、IMU运动传感器数据)实现理解,并生成...

