AI工程师指南:我是谁,从哪来,到哪去?|对谈硅基流动创始人袁进辉与独立开发者idoubi

原链 mp.weixin.qq.com

这篇访谈还挺通俗的,对于想了解AI和工程师的人来说值得一读,我是从头看到尾了。不过讲的很多东西都是常识,了解这些只是第一步,知易行难,能不能做到以及坚持下去就看个人了,不能太理想化。

袁进辉:人才的特质可以用两个维度来衡量:能力和冒险精神。那些既有能力又特别喜欢冒险的人,最适合创业;而有能力但不喜欢冒险的人,可能更适合在大公司工作;介于两者之间的人,则可以考虑加入其他创业公司。当然,还有一些折中的方案。比如像字节跳动的很多业务,是通过并购进入的。这也是一种解决思路:虽然加入了一个大公司,但是作为被并购的单位,仍然可以相对独立地运营一个新业务。例如,抖音就是被并购进字节后发展起来的。所以在创业和就业之间,还存在着多种可能性。

Duolingo 如何重新点燃用户增长

原链 mp.weixin.qq.com

这篇讲用户增长的文章比较有启发点的是里边的用户数据模型,对模型进行科学分析后找出优化的关键指标,也就是杠杆最有效的地方,然后用常见的增长激励方式就生效了。当然文章里也说了“我们必须运用我们的判断力来将这种游戏机制适应 Duolingo 的环境。”:

DAU、WAU 和 MAU 可以很容易地从这些区块中计算出来,这使得随着时间的推移对它们进行建模变得容易。这是该模型的一个关键特性。此外,通过操纵箭头所代表的比率,我们可以模拟随着时间推移这些比率的复合和累积影响;换句话说,这些比率是产品团队可以拉动以增长 DAU 的杠杆。

在创建模型后,我们开始每天拍摄数据快照,以创建过去几年来所有这些用户群和留存率如何逐日演变的历史。利用这些数据,我们可以创建一个前瞻性模型,然后进行敏感性分析,以预测哪些杠杆对 DAU 增长的影响最大。我们为每个比率运行了一个模拟,在三年内每季度将单个比率移动 2%,而保持所有其他比率不变。

选择 Rust 语言:Should I Rust or should I go?

原链 kerkour.com

一个 Rust 语言专家写的文章,说明 Rust 适合的领域和不适合的场景,觉得说得很实在,跟我实际使用的体验比较切合,而且作者在下面这两点的看法也很有品味:

The standard library is anemic

you then have many implementations and ecosystems competing for basic features such as cryptographic primitives, async runtimes or HTTP servers, leading to incompatibilities, bugs, busywork and lost time.

async is hard

Now you have sync functions and libs, async functions and libs, and different runtimes that are incompatible and thus require dedicated libraries for I/O. When discussing with a friend who is into Python, he told me that they are experiencing the exact same problem and it creates a lot of busywork writing wrapper for sync code to be called by async code.

Peewee ORM 作者评价 Python asyncio

原链 charlesleifer.com

Python async 感觉每过几年就要被人拿来否定下,这次是 Peewee 的作者,asyncio 和 Gevent 的项目我都经历过,感觉作者讲的挺有道理的:

Unlike asyncio, gevent transforms all the blocking calls in your application into non-blocking calls that yield control back to the event loop. As a result, you can continue to use the libraries you’re familiar with, and the exact same codebase can be run with or without gevent “enabled”

还好,社区这几年比较务实,在努力提升 Python 语言自身的性能

Open Prompt 发布一个月总结

原链 blog.t9t.io

一个独立开发者开发的 ChatGPT 相关产品,做得挺好的,他总结了产品的结果,并说了自己对这个方向的看法:

在过去的这一个月里面,OpenPrompt 获得了:

  • 16 万独立访客
  • 1.2 万个注册用户
  • 341 个付费用户
  • 收到付款 0.98 万人民币

OpenPrompt 的愿景

  • 当你面对一个无法想象大小的数据库,不知道如何挖掘数据时,给你一些例子,看看别人是怎么挖的。
  • 当你面对一个聪明人,不知道如何与他交流时,我们给你一些例子,看看别人是怎么问的。
  • 我们把这些挖掘,询问,变成可以复用的 Prompt,提升效率,节省时间。
Vim 作者 Bram Moolenaar 访谈

Vim 作者 Bram Moolenaar 访谈

原链 evrone.com

今天看到善用佳软翻译的《Vim作者访谈 2022》,就看了下,感觉还挺好玩的,有两点比较有共鸣吧:

  • 工程师以务实为先,选用能得到最好结果的工具和技术。话说我刚开始做软件也是出于对好软件的喜爱吧,包括像 Vim 这样非常强大的工具。

Software development is much more of a craft. And a craftsman uses whatever tools he thinks will get the best result, no matter if they are what everybody else is using or something different. And a good craftsman makes his own tools when needed.

  • 作息时间规律不熬夜,休息好以后往往第二天早上精力充沛了,会对问题有个全新的处理办法。这也是我个人的习惯吧,当然对别人不一定是这样的。

Most people have their most productive time in the morning, therefore it is much better to set a hard time limit on when to stop. Perhaps make a note of where you were, then relax a bit, get some good sleep and continue the next morning. Quite often the problem that you were stuck with yesterday suddenly gets a new insight and you know what to do. The term “sleep on it” actually works, at least it does for me.

Kafka 高可用要注意 __consumer_offsets topic

原链 medium.com

最近折腾 Kafka 的迁移和高可用时,两次碰到了这个坑,所以专门记下来并分享下,就是 __consumer_offsets topic 的 replication factor 一定要大于 1,具体可以看上边链接的文章,讲得非常清楚了。另外再说一个我自己碰到的误区吧,Kafka 停止的脚本是 kafka-server-stop.sh,但是脚本执行完后 server 是要经过一个清理的过程才会停的,所以如果看进程还在的话要等一会儿,不要着急着直接杀进程,否则可能会丢失数据,而且下次再启动时恢复又要好长时间了。

刚开始就面向性能选择编程语言可能是一种过早的优化

原链 snarky.ca

Python 核心开发者为 Python 性能问题辩护的文章,里边讲了些常识性的道理,比如要权衡开发的效率和快速原型迭代等;以及当要优化时可以采取的步骤和方法等,值得看一下。当然反对者也是有理由的,比如 PyPy 很多人总认为无法用到生产环境,也不大会去尝试;另外一些现代的静态编程语言比如 Go、Rust,它们本身的语言表达能力和简洁性也做得很好了,所以可选择的范围也多了。