专业配资股票公司 腾讯研究院AI速递 20240607

生成式AI专业配资股票公司

一、 高通亮出AI PC软硬件全家桶,联手微软建立AI PC新标准

1. 高通携手微软推出的Copilot+PC系列,成为AI PC新生态的重要推动力;

2. 高通的骁龙X系列处理器,特别是NPU技术,在性能和能效方面显著领先,成为AI PC实现颠覆性体验的核心;

3. 高通通过广泛的生态合作,与华硕、戴尔、惠普、联想等公司合作推出基于骁龙X系列的AI PC产品,加速市场布局,领先苹果一步。

https://mp.weixin.qq.com/s/OU3GFM_jS2BeRu3ToVy-JQ

二、 斯坦福让“GPU高速运转”的嵌入式CUDA工具ThunderKittens

1. 斯坦福设计了ThunderKittens工具,内核代码仅100行,性能比FlashAttention-2提升30%,优化了H100 GPU的效率;

2. ThunderKittens利用寄存器和共享内存的tiles抽象,简化AI内核编写,充分发挥底层硬件能力,实现高硬件利用率;

3. 研究揭示了H100 GPU的特性,如WGMMA指令的复杂内存布局、共享内存的访问延迟和TMA指令的异步数据传输的重要性。

https://mp.weixin.qq.com/s/sRm7sfVQqXVJygc3AGJ3xQ

三、 OpenAI首次公开前沿大模型安全策略:基础架构、保护措施等

1. OpenAI首次公开大模型安全策略,涵盖基础架构、保护措施、敏感数据存储和访问管理;

2. 使用Azure Entra ID和Kubernetes进行身份验证和管理,确保最小权限访问和安全网络策略;

3. 引入AccessManager服务管理敏感数据访问,多方批准机制保护模型权重,定期进行安全红队测试和合规评估。

https://mp.weixin.qq.com/s/8jJ-ytZob74HiurMRD2aoQ

四、 快手版Sora「可灵」开放测试:生成超120s视频,更懂物理

1. 快手推出的可灵大模型支持生成超120秒的高清视频,能准确模拟复杂运动和物理特性;

2. 可灵采用类Sora的Transformer架构,结合自研技术实现高效计算和高质量视频生成;

3. 可灵已在快影APP中开放测试,支持多种控制信息输入,并推出了AI舞王等多项应用。

https://mp.weixin.qq.com/s/-knHZA4AU47EkkzIO7O18A

五、 “中国版Sora”视频大模型Vidu重大更新,32秒音视频合成

1. Vidu视频大模型更新,实现32秒视频生成,支持音视频合成及4D内容生成;

2. Vidu采用Diffusion与Transformer融合架构U-ViT,实现1080P高清视频生成,具备高动态性和时空一致性;

3. Vidu模型继续迭代,提升长时长和多模态能力,获得数亿元融资,推动技术与产业应用深度融合。

https://mp.weixin.qq.com/s/zOsgAm8v-C44qWhz-TSUsw

六、 开源音频模型Stable Audio Open,文本生成47秒高清音效

更为奇特的是其中一些穴位,具有一些特殊的功用:排毒、清火的作用,如果我们掌握了这些穴位及其特殊功用,通过经常对它们进行艾灸可以使我们的身体更加健康!

口干舌燥为啥到骨科就诊?据河南省中医院骨病一科主任郭会卿主任医师介绍,干燥综合征是一种以侵犯泪腺、唾液腺等外分泌腺体为主的慢性自身免疫性结缔组织疾病,有很多种类型表现,如口腔干燥、严重龋齿、皮肤干燥、眼部干燥等。严重的可能引起肝硬化,肾小管功能受损,少数人还可能合并淋巴瘤。如果口干舌燥的症状持续十天半个月没有好转,就需警惕干燥综合征。

1. Stability.ai开源Stable Audio Open,用户可通过文本生成最多47秒、44.1kHz的高质量音效,包括钢琴、笛子、鼓点和模拟人声;

2. Stable Audio Open支持数据微调,音乐人可根据自身数据定制音效,生成的音效具备商业许可;

3. 模型使用近50万个录音数据训练,支持英文提示词,提供时间、扩散步数和CFG控制,但目前仅限学术研究使用。

https://mp.weixin.qq.com/s/bz0rtEwNyUWdlz8_3b40LQ

七、 Seed-TTS:几乎完美接近人类的文本到语音(TTS)模型

1. Seed-TTS是字节开发的高级文本到语音模型,生成的语音几乎无法与人类区分,适用于小说和视频配音;

2. 支持情感、语调、说话风格等多种属性的控制,能生成富有表现力的语音,满足不同场景需求;

3. 具备Zero-shot能力和语音内容编辑功能,无需训练数据即可生成高质量语音,并支持语音内容和速度的灵活调整。

https://mp.weixin.qq.com/s/40y1jFJlFFjxoUWkgjnJbw

八、 Meta 翻译大杀器NLLB200登上Nature:翻译质量提高44%

1. Meta发布No Language Left Behind (NLLB)模型,支持200种语言翻译,质量提升44%,尤其在低资源语言上表现显著;

2. NLLB-200采用稀疏门控专家混合(MoE)架构,通过动态激活专家网络优化多语言任务的处理性能;

3. 项目使用创新的数据挖掘和多语言联合训练方法,提高了低资源语言的翻译性能,并集成有害内容检测器以确保安全性。

https://mp.weixin.qq.com/s/YXBOrAxN56azQSi-vbst-g

前沿科技

九、 揭秘100年全球海洋脱氧,上交大通过人工智能重建「窒息的海洋」

1. 上海交大团队开发OxyGenerator模型,利用AI重建1920至2023年全球海洋溶解氧数据,重建性能超越传统数值模式;

2. 模型显示过去百年溶解氧最小值区域面积扩大三倍,揭示海洋脱氧趋势对生态系统的影响;

3. OxyGenerator采用多层感知机、双向LSTM和自适应分区图消息传递机制,结合海洋学知识,显著提升重建精度。

https://mp.weixin.qq.com/s/57IZHBKqYp_sV9DX7bTyhw

报告观点

十、 “AI 热会逐渐降温,AGI 普及不了多少场景!”对话《Core Java》作者 Cay Horstmann

1. Cay Horstmann认为AI热潮将逐渐降温,AGI普及场景有限,AI工具如Copilot可以辅助但不会取代人类开发者;

2. 强调学习多种编程语言的重要性,精通一种语言并掌握快速学习其他语言的能力更为关键;

3. 建议开发者通过开源项目和实际工作积累经验,并注重理解软件工程和业务需求,倡导持续学习和实践。

https://mp.weixin.qq.com/s/EjBdhK-22LuypcrX5vbCJQ

👇订阅下方合集专业配资股票公司,获取每日推送

高通模型语音httpsVidu声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。