签到
立即签到
签到可以获得积分哦!
公告
AI千集是一个智能写作平台
在这里您可以获得本平台自训练的
LLM模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,写作快人一步
扫一扫,加入我们
有加群需求的小伙伴,请微信加qianji_ai
千集助理是连通AI学研和就业的桥梁
登陆小程序
获取文案智能写作能力
工作效率瞬间提升
最新资讯更多
-
DeepSeek遭大规模恶意攻击,攻击IP均来自美国
近日,人工智能公司DeepSeek遭遇大规模恶意网络攻击,攻击的IP地址均来自美国。此次攻击导致DeepSeek的服务器承受巨大压力,部分服务出现短暂中断。DeepSeek技术团队迅速响应,成功抵御了攻击并恢复了正常服务。公司表示,已加强网络安全防护措施,并将进一步调查攻击来源。此次事件再次引发对全球网络安全问题的关注。
喜欢 0 评论 0
-
硅谷巨头围剿DeepSeek,OpenAI与Anthropic联手质疑其模型训练方式
近日,OpenAI和Anthropic对DeepSeek发起了联合质疑,指控其利用OpenAI的模型进行训练,涉嫌侵犯知识产权。OpenAI声称发现了DeepSeek“蒸馏”其模型的证据,即通过大模型的输出来提升小模型的性能。微软也对此展开调查。尽管DeepSeek在成本控制上表现出色,但OpenAI和Anthropic认为其模型水平仅相当于他们7-10个月前的水平。与此同时,微软在质疑后迅速将DeepSeek模型接入其AI平台,引发网友热议。目前,各方对DeepSeek的质疑仍在调查中,OpenAI拒绝进一步置评。
喜欢 0 评论 0
-
微软推出首个FP4训练框架,大模型训练开销显著降低
微软研究院推出了首个FP4精度的大模型训练框架,该框架在相同超参数设置下,能够达到与FP8和BF16相当的训练效果,同时显著减少存储和计算资源的需求。该框架通过FP8模拟FP4,支持高达130亿参数的模型训练,训练Tokens数量达到千亿级别。研究团队采用定制化的FP4矩阵乘法CUDA内核,结合混合精度设计,确保训练数值稳定性并降低计算和存储开销。该框架由微软亚洲研究院和SIGMA团队开发,主要研究人员包括中科大博士生Ruizhe Wang等。
喜欢 0 评论 0
-
DeepSeek绕过CUDA垄断,V3论文揭示技术突破
DeepSeek团队在开发AI模型时,绕过了英伟达的CUDA技术,直接针对GPU的低级汇编语言PTX进行优化,实现了性能的最大化。这一突破在短短两个月内,使用2048个H800 GPU集群训练出6710亿参数的MoE语言模型,效率比顶尖AI高出10倍。DeepSeek的优化策略包括细粒度线程调整和流水线算法,远超常规CUDA开发水平。尽管PTX编程复杂且难以维护,但DeepSeek团队的技术实力使其成功实现了这一创新。这一突破可能对英伟达等公司的市场地位产生影响,同时也展示了AI开发中数据处理和算法优化的巨大潜力。
喜欢 0 评论 0
-
张雄:虚拟经济需依托实体经济,否则将成虚幻存在
上海财经大学教授张雄指出,虚拟经济的崛起并未否定物质第一性原理,而是对实体经济的高度抽象。他强调,虚拟经济必须依托于实体经济,否则将成为虚幻的存在。张雄认为,辩证唯物主义物质第一性原理仍是智能化时代经济世界观的根本依据。他提出,未来学者应深入研究数字经济与无形经济的关系,以及无形经济带来的意识能动性原理。张雄还指出,人工智能在精准性和实证性方面表现出色,但人类在情感方面更具灵性。
喜欢 0 评论 0
-
德宏腌菜膏科研成果登上国际刊物
德宏腌菜膏的科研成果近日登上国际刊物,标志着其在食品科学领域的重要突破。该研究详细分析了腌菜膏的制作工艺、营养成分及其对人体健康的潜在益处。这一成果不仅提升了德宏腌菜膏的国际知名度,也为当地特色食品的推广和产业发展提供了科学依据。
喜欢 0 评论 0
积分排行
- gingo
104 帖子 • 8 评论
1421 - 13718610631
0 帖子 • 0 评论
997 - weilaiweiding
52 帖子 • 1 评论
821 - openoker
157 帖子 • 22 评论
288 - boatingman
0 帖子 • 1 评论
90 - toc
0 帖子 • 0 评论
60 - Van
3 帖子 • 0 评论
42 - limin1109
2 帖子 • 0 评论
24 - shadow
5 帖子 • 0 评论
22 - a15013996963
1 帖子 • 0 评论
21