• [智能分析]视频号矩阵怎么做?

    随着短视频平台的崛起,视频号作为微信生态中的重要组成部分,已经成为企业和个人品牌推广的重要工具。构建一个高效的视频号矩阵不仅可以提升品牌的曝光度,还能有效推动私域流量的转化。本文详细探讨如何搭建和运营视频号矩阵,并提供具体的实施步骤和策略...
  • [博客翻译]我为编程语言介绍写了一个剧本

    Jan Miksovsky 是一位专注于 Web 技术和个人项目的开发者和博主。他最近分享了几个有趣的项目,让我们一起来看看吧! 用动图漫画介绍编程语言 Jan 为 Origami 编程语言制作了一个交互式的动图漫画(motion comic),你可以在浏览器中直接播放。这种形式非常新颖,它通过视觉效果和声音引导用户学习 Origami 的基本概念。 动图漫画的优点: 用户可以自己控制节奏,不像视频那样被动观看。 制作过程比传统录屏更灵活,因为 Jan 可以直接用代码模拟用户界面,而无需操作真实的程序。...
  • [论文翻译]DeepSeek-R1:通过强化学习提升大语言模型的推理能力

    我们推出了第一代推理模型,DeepSeek-R1-Zero 和 DeepSeek-R1。DeepSeek-R1-Zero 是一个通过大规模强化学习 (RL) 训练而成的模型,没有经过监督微调 (SFT) 作为初步步骤,展现了卓越的推理能力。通过 RL,DeepSeek-R1-Zero 自然衍生出许多强大且有趣的推理行为。然而,它也面临诸如可读性差和语言混合等挑战。为了解决这些问题并进一步提升推理性能,我们推出了 DeepSeek-R1,它在 RL 之前引入了多阶段训练和冷启动数据。DeepSeek-R1 在推理任务上达到了与 OpenAI-o1-1217 相当的性能。为了支持研究社区,我们开源了 DeepSeek-R1-Zero、DeepSeek-R1 以及基于 Qwen 和 Llama 从 DeepSeek-R1 蒸馏出的六个稠密模型 (1.5B, 7B, 8B, 14B, 32B, 70B)。
  • [博客翻译]NsJail:一个轻量级的Linux进程隔离工具

    nsjail 一个轻量级的进程隔离工具,利用Linux命名空间和seccomp-bpf系统调用过滤器(借助kafel bpf语言) 查看GitHub 概述 它提供了哪些隔离形式 支持的用例 网络服务的隔离(inetd风格) 访问私有克隆接口的隔离(需要root/setuid权限) 本地进程的隔离 本地进程的隔离(并在必要时重新运行) 使用示例 在最小文件系统中运行Bash,uid==0且仅访问/dev/urandom 在最小文件系统中运行/usr/bin/find(仅从/usr/bin访问/usr...
  • [博客翻译]GNU Make标准库

    GNU Make 标准库 GNU Make 标准库(GMSL)是一个使用原生 GNU Make 功能实现的函数集合,提供了列表和字符串操作、整数运算、关联数组、栈以及调试工具。GMSL 以 BSD 许可证发布。[项目页面] [发布版本] 使用 GMSL 需要两个文件:gmsl 和 __gmsl。要在你的 Makefile 中包含 GMSL,可以这样做: include gmsl gmsl 会自动包含 __gmsl。要检查你使用的 GMSL 版本是否正确,可以使用 gmsl_compatible 函数(见下...
  • [智能分析]DeepSeek R1 报告

    在人工智能(AI)领域,DeepSeek R1模型的推出标志着一个重要的里程碑。作为中国DeepSeek公司开发的最新AI模型,DeepSeek R1以其卓越的推理能力和高效的资源利用率迅速引起了全球技术界的关注。本文将深入探讨DeepSeek R1的特点、性能、与OpenAI的o1模型的比较,以及其对市场的影响。DeepSeek R1是一种“推理优先”的AI模型,旨在超越传统语言模型,特别是在数学和编码任务上表现突出。根据报道,DeepSeek R1的训练成本仅为55...
  • [博客翻译]林迪效应

    林迪效应:时间越久远,寿命可能越长? 你是否想过,为什么某些书籍、技术或文化能够流传数百年?而有些东西在诞生后却迅速消逝?答案可能与“林迪效应”(Lindy Effect)有关。 什么是林迪效应? 林迪效应是一种理论现象,它指出某些非消耗性事物(如技术、思想、艺术作品等)的未来预期寿命与其当前寿命成正比。换句话说,一个事物已经存在的时间越长,它的剩余寿命可能会越长。 例如,一本已经出版了40年的书,根据林迪效应,我们可以预计它还会再存在40年。但如果这本书又多存在了10年(即总寿命达到50年),那么它的预期...
  • [博客翻译]电子游戏历史基金会图书馆开放早期访问

    游戏历史基金会(VGHF)数字档案馆开启抢先体验 免费开放,全球共享! 今天,游戏历史基金会(Video Game History Foundation,简称VGHF)正式推出了其数字档案馆的抢先体验版。从现在起,用户可以访问library.gamehistory.org,获取丰富的电子游戏历史研究资料。 自2017年成立以来,VGHF一直在构建一个数字化图书馆,旨在帮助推动电子游戏历史的研究工作。我们的收藏包括游戏开发文件、幕后内容、稀有的游戏出版物和目录、杂志、纪念品、宣传材料等丰富资源。 经过多年的...
  • DeepSeek R1与OpenAI o1:哪一个更快、更便宜、更智能?

    DeepSeek R1它已经到来,它不仅仅是另一种人工智能模型,它是人工智能能力的重大飞跃,是在之前发布的[DeepSeek-V3-Base变体]上训练的. 随着DeepSeek R1的全面发布,它现在在性能和灵活性方面与OpenAI o1不相上下。更引人注目的是它的开放权重和MIT许可,使其在商业上可行,并将其定位为开发人员和企业的有力选择。 The [DeepSeek R1]has arrived, and it’s not just another AI model—it’s a significant leap in AI capabilities, trained upon the previously released [DeepSeek-V3-Base variant](https://www.analyticsvidhya.com/blog/2024/12/deepseek-v3/). With the full-fledged release of DeepSeek R1, it now stands on par with OpenAI o1 in both performance and flexibility. What makes it even more compelling is its open weight and MIT licensing, making it commercially viable and positioning it as a strong choice for developers and enterprises alike. 但真正让DeepSeek R1与众不同的是它如何挑战像OpenAI这样的行业巨头,用一小部分资源取得显著成果。在短短两个月内,DeepSeek完成了看似不可能的事情——推出了一个与专有系统竞争的开源人工智能模型,同时在严格的限制下运行。在本文中,我们将比较DeepSeek R1和OpenAI o1。
  • [博客翻译]全局变量不是问题

    代码风格与品味 这是一个分享我对代码和实践的思考的博客 在这篇文章中,我将展示一个例子,说明避免使用全局变量如何导致了一个错误,我将定义什么是全局变量,解释问题所在,然后给出我成功使用它们的例子。 全局变量不是问题 我们都被告知全局变量是不好的。它们可以在任何地方被修改,有时会强制函数以特定顺序调用,如果程序足够大或状态足够随机,可能无法调试。我们通常在编程的第一年就被教导不要使用它们,但许多人从未弄清楚什么时候应该使用。 首先,我们来看没有全局变量的代码。在这里,我们想看看在抛出异常(未显示)之前,“si...
  • [博客翻译]Autothrottle:面向SLO的微服务的资源管理

    Autothrottle:一种针对微服务的实用双层资源管理方法 作者: 王自博(中国科学技术大学 & 微软研究院)、李平河(苏黎世联邦理工学院)、梁捷贤(Mike)(微软研究院)、吴锋(中国科学技术大学)、颜弗朗西斯(微软研究院) 获奖信息:荣获杰出论文奖! 摘要: 在云计算环境中,确保资源高效利用的同时保持用户体验并非易事。随着云应用越来越多地采用微服务架构,资源管理者需要面对两种截然不同的系统行为层次:端到端应用延迟和单个服务的资源使用。然而,在这两者之间进行转换极具挑战性,因为用户请求会经过多个异构...
  • [博客翻译]Jane Street如何意外地为OCaml构建了一个更好的构建系统

    构建系统是开发者工具箱中最重要的工具之一。简单来说,它负责从一堆不同的源文件中生成可运行的程序,调用编译器、设置并执行测试套件等。由于开发者每天都要与它打交道,因此它必须快速——但同时也需要具备灵活性。大约在2012年,我们对当时OCaml的标准构建系统OMake感到不满,于是决定自己构建一个新的系统,我们称之为Jenga。Jenga在我们内部运行得很好,我们认为更广泛的社区可能也会觉得它有用。于是我们决定开源Jenga,希望其他人试用后会喜欢它,甚至可...
  • [博客翻译]Prolog的简洁性

    如今,最流行的编程语言包括Python、Javascript、Java、C++、C#、Kotlin和Ruby,大多数程序员可能熟悉其中一种或多种语言。这些语言之间的切换相对容易(除了可能需要掌握特定的框架知识),因为它们都是命令式(大部分也是面向对象)语言,设计上非常相似。命令式语言关注的是如何解决问题,通过一系列指令来操作状态。它们的流行有多个原因。首先,它们被认为易于学习,因为可以轻松地将内存中的物理单元想象为存储值,并...
  • [博客翻译]OpenAI为开放的万维网敲响了最后的丧钟

    本周,OpenAI发布了一款名为Operator的新产品。Operator基本上是一个AI代理,可以为你浏览网页。他们并不是第一个这么做的,Anthropic几个月前发布了一个叫“电脑使用”的东西,但凭借他们的品牌知名度,他们引起了轰动。我认为Operator是开放互联网终结的开始。如果你最近像我一样频繁使用ChatGPT,你会注意到它已经彻底改变了我们获取信息的方式。以前,如果我想了解法国大革命,我会在...
  • [博客翻译]Show HN:用Ollama诱骗短信垃圾邮件发送者

    我偶尔会收到一些房产经纪人的短信,他们想在我家乡购买特定的房产,而我在那里既没有房产也不居住。我猜他们是从白页(WhitePages)上抓取了手机号码,然后广撒网,希望能得到回复。 典型的垃圾短信 我父母在镇中心有一些未开发的土地,大部分位于洪水区,实际可用的面积比纸面上看起来要少得多。当然,经纪人并不知道这一点,所以购买一大块几十年来一直空置的土地,价格便宜,可能让他们垂涎三尺。 ...
  • [博客翻译]神话般的IO绑定Rails应用程序

    我打算写一篇关于Pitchfork的文章,解释它的起源、现状以及我对它未来的看法。但在深入探讨之前,我觉得有必要先澄清一些概念。 每当谈及Rails性能时,常听到的说法是数据库是瓶颈,因此Rails应用本质上是IO密集型的,Ruby的性能并不那么关键,只需适当增加并发就能让服务扩展自如。 但这种说法真的普遍适用吗? 混淆规模与性能 首先,确实,在扩展Rails应用时,首先遇到的主要瓶颈通常是数据库。 Rails,如同绝大多数现代Web框架,是无状态的,...
  • [博客翻译]LoongArch64主观强光灯

    引言 最近我重新开始研究 simdutf,发现这个库已经支持了 LoongArch64。这是中国龙芯公司设计的自定义架构和自定义指令集架构(ISA)。他们提供了标量指令集的文档,但没有提供向量扩展的文档。尽管如此,GCC、binutils、QEMU 和其他工具已经支持这个指令集。幸运的是,陈嘉杰(Jiajie Chen)对向量扩展进行了逆向工程,并将结果发布在网上,名为 非官方 ...
  • [博客翻译]用150行Python代码构建全文搜索引擎(2021)

    用150行Python代码构建全文搜索引擎 全文搜索无处不在。无论是在Scribd上找书,Netflix上找电影,亚马逊上找卫生纸,还是通过谷歌在网络上搜索任何东西(比如如何做好软件工程师的工作),你今天已经多次搜索了大量的非结构化数据。更令人惊讶的是,尽管你搜索了数百万(甚至数十亿)条记录,你仍然能在几毫秒内得到结果。在这篇文章中,我们将探索全文搜索引擎的基本组成部分,并用它们构建一个能够在几毫秒内搜索数百万文档并根据相关性进行排序的搜索引擎,代码不超过150行Python! 数据 本文中的所有代码都可以...
  • [博客翻译]Bun 1.2发布

    Bun 1.2 发布 Bun 是一个用于构建和测试全栈 JavaScript 和 TypeScript 应用的完整工具包。如果你还不熟悉 Bun,可以通过 Bun 1.0 的博客文章了解更多。 Bun 1.2 更新亮点 Bun 1.2 是一个重大更新,我们非常兴奋地与大家分享。以下是 Bun 1.2 的主要变化: Node.js 兼容性:Bun 在 Node.js 兼容性方面取得了重大进展。 内置 S3 对象存储 API:新增了 Bun.s3,支持与 S3 存储的交互。 内置 Postgres 客户端:新...
  • [论文翻译]K1MI K1.5:使用大语言模型扩展强化学习

    通过下一个Token预测进行语言模型预训练已被证明对计算扩展有效,但受限于可用训练数据的数量。扩展强化学习(RL)为人工智能的持续改进开辟了新维度,有望使大语言模型(LLMs)通过奖励探索来扩展其训练数据。然而,先前发表的工作尚未产生具有竞争力的结果。鉴于此,我们报告了Kimi k1.5的训练实践,这是我们最新采用RL训练的多模态大语言模型,包括其RL训练技术、多模态数据配方和基础设施优化。长上下文扩展和改进的策略优化方法是我们的关键要素,这些方法建立了一个简单有效的RL框架,无需依赖更复杂的技术,如蒙特卡罗树搜索、价值函数和过程奖励模型。值得注意的是,我们的系统在多个基准和模态上实现了最先进的推理性能——例如,AIME上77.5分,MATH 500上96.2分,Codeforces上94百分位,MathVista上74.9分——与OpenAI的o1相当。此外,我们提出了有效的长到短方法,利用长链思维(CoT)技术改进短链思维模型,取得了最先进的短链思维推理结果——例如,AIME上60.8分,MATH500上94.6分,Live Code Bench上47.3分——大幅超越现有的短链思维模型,如GPT-4o和Claude Sonnet 3.5(最高达\$+550\%\$)。
公告

AI千集是一个智能写作平台
在这里您可以获得本平台自训练的
LLM模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,写作快人一步
扫一扫,加入我们
公众号
有加群需求的小伙伴,请微信加qianji_ai

千集助理是连通AI学研和就业的桥梁
登陆小程序
获取文案智能写作能力
工作效率瞬间提升

千集助理