• [博客翻译]用150行Python代码构建全文搜索引擎(2021)

    用150行Python代码构建全文搜索引擎 全文搜索无处不在。无论是在Scribd上找书,Netflix上找电影,亚马逊上找卫生纸,还是通过谷歌在网络上搜索任何东西(比如如何做好软件工程师的工作),你今天已经多次搜索了大量的非结构化数据。更令人惊讶的是,尽管你搜索了数百万(甚至数十亿)条记录,你仍然能在几毫秒内得到结果。在这篇文章中,我们将探索全文搜索引擎的基本组成部分,并用它们构建一个能够在几毫秒内搜索数百万文档并根据相关性进行排序的搜索引擎,代码不超过150行Python! 数据 本文中的所有代码都可以...
  • [博客翻译]别让字典毁了你的代码——Python编程中的替代方案

    在编程中,字典(dict)因其简洁而常被滥用,但过度依赖它们可能会带来维护难题。让我们来看看字典存在的问题,并探讨如何用现代Python工具来优化。当你编写接受字典作为参数的函数时,扩展和修改这些函数就像噩梦一样。要改变处理字典的函数,你可能需要追溯到字典创建的地方,这在程序复杂且无规划增长时尤为困难,可能导致数据结构不一致。程序员常常滥用字典的可变性,随意修改其值以适应特定工作流程。这种即席修改会破坏...
  • [博客翻译]多版本Python思考

    随着uv库的快速发展,我重新开始研究如何让Python支持同时使用不同版本的库。目标是uv能解决多个不兼容版本的库之间的依赖冲突,比如一个库可以同时依赖pydantic 1.x和2.x。简单来说,设想一个库能够同时使用pydantic 1.x和2.x,而不影响彼此。目前我还没实现,但已经找到了阻碍的关键点。这篇博客主要是分享如何在尽量减少对Python改动的前提下实现这一目标...
  • [博客翻译]GIL在Python 3.13中变为可选

    在Python 3.13版本中,一个重要的变化是GIL(全局解释器锁)的可选性。GIL是CPython解释器为了确保任何时候只有一个线程执行Python字节码而设计的机制。从Python 3.13开始,这个长期存在的限制可能会被解除,允许更多的并发执行。 什么是GIL? GIL是一个保证同一时间只有一个线程运行的核心机制,这对于单线程执行的Python代码来说是必要的,但对多线程应用来说可能是个瓶颈,因为它限制了真正的并行计算。
创作中心
开启你的AI千集创作之旅
发布首篇内容,开通创作中心 快来成为AI千集创作者吧~
公告

AI千集是一个智能写作平台
在这里您可以获得本平台自训练的
LLM模型服务
和小伙伴一起玩转AI,做自己的AI机器人
来AI千集,写作快人一步
扫一扫,加入我们
公众号
有加群需求的小伙伴,请微信加qianji_ai

千集助理是连通AI学研和就业的桥梁
登陆小程序
获取文案智能写作能力
工作效率瞬间提升

千集助理