Get live statistics and analysis of Tom Cao's profile on X / Twitter

宝玉老师一针见血。AI在自动化“写代码”，但工程师的核心价值从来都不是“写代码”，而是“管理复杂性”。一个生产级的软件，是成百上千个简单逻辑在极端并发、严苛容错下的“协同”，这叫“工程”。AI目前只能处理“孤立”问题，处理不了“协同”。

Tom Cao@tomcaokol35578 · Oct 26

理性讨论一下哈。😂😂 很多人爱看‘富人精神贫瘠’的故事，本质上是一种心理安慰——‘你看，我虽然没钱，但我精神富足’。如果你陷入这种叙事节奏的话。。。我来打醒你。精神贫瘠和钱没关系，和‘认知’有关系。那个阿里老员工，就算当年没进淘宝，在老家当个科员，大概率也是个下馆子点菜和老婆吵架、天天聊亲戚八卦的庸人。钱只是放大了他‘本来就贫瘠’的特质。精神生活不是穷人的遮羞布，也不是富人的原罪。它是一种需要刻意训练和投入的‘能力’。没钱没时间，固然很难；但有钱有闲，却‘懒得投入’，那才是真正的悲剧。

Tom Cao@tomcaokol35578 · Nov 07

简中推圈子就这么几个人吗，来来回回都是那些面孔，还是说我只是进入了信息茧房？谁知道简中推圈子月活大v的数量级是多少？

Tom Cao@tomcaokol35578 · Oct 29

聪明人如果不能让傻子舒服，聪明人会被清除。 1、别炫耀，不解释，不教育。让结果自己发声，而不是让语言刺痛他们的认知。 2、伪装成执行者，但做架构者的事。让别人以为你在“配合”，实际上你在“引导演化”。 3、切断情绪投射。不要陷入“我比他们强”的优越情绪。那只会让你失去策略重心。 4、建立独立系统。慢慢地让你的系统（工具链、AI代理、思维模型）自己创造复利成果，到一定量级后自然无法被忽视。

564

宝玉老师点到了关键。我补充一点：那 50% 的 AI 代码，很可能都用在了‘新项目’和‘边缘功能’上。像公众号编辑器这种沉淀了十年的‘祖传代码屎山’，AI 根本不敢碰，一碰就得重构。 AI 目前擅长的是‘绿地项目’（从0到1），而不是在‘棕地项目’（技术债）里排雷。这才是它难用的根源。

Tom Cao@tomcaokol35578 · Nov 07

总结得很好，核心就一条：写作的本质，是把“以我为中心”的炫耀，切换到“以读者为中心”的服务。什么时候你不再关心“我想表达什么”，而是关心“读者需要什么”，什么时候你的文字才真正开始值钱。

恰恰相反。 1、做人需要“战友”，不需要“朋友”。 2、社会的本质是价值交换，“人吃人”是你价值太低时发生的极端情况。 3、你没本事，根源在你，别怪父母。 4、上流社会忙着定规则，下流社会忙着抱怨规则。

496

Tom Cao@tomcaokol35578 · Oct 19

技术、代码、学历、钱，都重要。只有当你在某一项上做到顶级，才有资格说它“不重要”。那些嘴上说“技术不重要”的人，往往是在自己的阶段、自己的舒适区里说的。你一个还没到大厂应届生水平的人真信了？——那就真蠢。就像学霸说“这次没考好”，学渣一问，“考了多少？” “146。” ……这对比说明一切。

很多人把因果搞反了。不是你先有了“好气质”，才吸引到好运气。而是你搞定了具体的事、解决了棘手的问题、坚持了100天健身，你外显的“精气神”自然就上来了。气质是实力的副产品，不是许愿池。先做事，气场自然来。

223

Tom Cao@tomcaokol35578 · Oct 17

同样，在个人社交中： •你可能有5000个微信好友，但真正信任的不过30人； •稍远的100人属于“弱关系”，是社会资源； •再往外，就是噪声和社交负担。 150这个界限，是认知带宽的上限、信任分配的边界、组织复杂度的起点。

392

Tom Cao@tomcaokol35578 · Oct 20

你的大脑是“总司令”，它极度昂贵，绝不能用于记忆“事实性”垃圾。它只负责制定战略、识别模式和下达指令。大脑必须抓死的东西： 1. 元认知（Metacognition）： • “我目前这个思考框架是不是错了？” • “我为什么会相信这个观点？” • “我解决这个问题的第一步应该是什么？” • 你必须时刻审视你自己的思考过程。 2. 第一性原理（First Principles）和核心框架（Core Frameworks）： • 不是“马斯洛需求的五层是什么”，而是“马斯洛这个框架试图解决什么问题？它对我理解‘激励’有什么本质帮助？” • 不是记住“SWOT分析法”，而是理解“为什么需要同时看‘内部/外部’和‘优势/劣势’这四个维度？” • 你只记最核心的逻辑骨架，记那些“万变不离其宗”的“宗”。 3. 高质量的问题（High-Quality Questions）： • 这是你大脑最重要的产出。你不是要记住答案，而是要提出能直击要害的问题。 • “这个方案的致命假设是什么？” • “如果把时间拉长到10年，这件事还重要吗？” 4. 个人价值观与决策准则（Your Values & Principles）： • “我做事的底线是什么？”“我评判‘成功’的标准是什么？” • 这是你的“操作系统内核”。当AI给你A、B、C三个选项时，你必须依靠这个内核来做决策。AI没有价值观，你必须有。大脑的“禁区”（绝对不能碰）： • 零散的“知识点”（如“某某函数的具体语法”、“某某历史事件的年份”）。 • 可以被轻易搜索到的“事实”（Fact）。 • 别人的、未经你批判的“观点”。

Tom Cao@tomcaokol35578 · Oct 22

发一个互动贴，需要我关注的朋友，评论区说一声，凡是关注我的，我都会回关注。无论粉丝多少，不管是不是蓝V，都是一视同仁，永不取关。

144

Tom Cao@tomcaokol35578 · Oct 29

你认为的你的目标实现过程VS你实际实现目标遇到的挫折困难。 be like：

183

Tom Cao@tomcaokol35578 · Oct 31

6个从《设计数据密集型应用》中学到的颠覆性认知作为软件工程师，我们每天都在构建数据系统。在这个过程中，我们常常依赖于一些关于性能、可扩展性和正确性的普遍假设。然而，令人惊讶的是，这些我们认为理所当然的认知，实际上非常脆弱，甚至是完全错误的。我们习惯于使用各种工具提供的抽象，却很少深入探究其内部原理，这使得我们在面对复杂问题时常常束手无策。 Martin Kleppmann 的《设计数据密集型应用》（Designing Data-Intensive Applications, DDIA）正是这样一本剥开抽象层、揭示数据系统背后永恒不变基本原则的经典著作。它不追逐时髦的技术，而是系统性地剖析了数据系统的基本公理，让我们能够从根本上理解系统行为，做出更优的设计决策，并诊断棘手的问题。本文将从这本书中提炼出六个最具颠覆性、最反直觉、也最具影响力的认知。它们挑战了行业中的许多传统智慧，为我们思考系统设计提供了一条更清晰、更根本的路径。无论你是刚入门的新手还是经验丰富的架构师，这些认知都将迫使你重新审视自己构建系统的方式。 -------------------------------------------------------------------------------- 1. 性能指标的“平均值”毫无意义我们经常在报告中看到“平均响应时间”这个指标，它似乎已经成为衡量系统性能的通用语言。但 DDIA 指出，这是一个极具误导性的指标，因为它完全没有告诉你到底有多少用户真正经历了那种延迟。一个糟糕的“平均值”可能会掩盖掉一部分用户极其糟糕的体验。书中推荐使用百分位数（percentiles）作为更科学的替代方案。中位数（p50）代表了“典型”的用户体验：一半用户的请求比这个值快，另一半则更慢。它能准确反映大多数用户的感受，而不是被少数极端离群值所扭曲。更重要的是高百分位数，如 p95、p99 和 p99.9（也称为“尾部延迟”）。这些指标揭示了系统中那些最慢的请求究竟有多慢。为什么这很重要？因为尾部延迟直接与商业价值挂钩。亚马逊的观察表明，响应时间增加100毫秒会导致销售额下降1%，其他报告也指出，1秒的延迟会使客户满意度指标降低16%。那些经历最长延迟的用户，往往是对你最有价值的用户。那些请求最慢的客户，通常是那些账户里数据最多的客户，因为他们进行了很多次购买——也就是说，他们是你最有价值的客户。关注百分位数，迫使我们去构建一个对所有用户都表现良好的系统，而不仅仅是为那个可能根本不存在的“平均”用户。这不仅是技术上的严谨，更是对用户体验和商业价值的真正负责。 -------------------------------------------------------------------------------- 2. “可扩展”不是一种特性，而是一个问题我们常听到这样的说法：“技术X是可扩展的”或“那个系统扩展性不好”。DDIA 一针见血地指出，这种说法毫无意义。可扩展性（Scalability）不是一个可以简单贴在系统上的标签，也不是一个非黑即白的特性。讨论可扩展性，意味着要回答一个非常具体的问题：“如果系统负载以某种特定的方式增长，我们有哪些应对策略？” 关键在于描述负载。负载不是单一维度，它由一组负载参数（load parameters）来定义，比如Web服务器的每秒请求数、数据库的读写比例、缓存命中率等等。书中用 Twitter 的主页时间线作为经典案例进行了阐述。早期Twitter有两种实现方式：方法1: 用户请求主页时间线时，实时查询他关注的所有人，获取他们发布的推文，然后合并排序。这种方式逻辑简单，但在读取负载很高时很快就遇到了瓶颈。（这在概念上被称为“读时扇出”）。方法2: 为每个用户维护一个类似“收件箱”的时间线缓存。当一个用户发布推文时，系统会查找所有关注他的人，并将这条新推文写入到每一个关注者的缓存中。这样读取主页时间线就变得非常快，但写入的成本大大增加。（这在概念上被称为“写时扇出”）。由于Twitter的负载模式是“读多写少”（主页时间线读取请求比发推请求高出近两个数量级），它最终选择了方法2。这个案例的关键在于，Twitter 的扩展性挑战并非来自推文的总量，而是来自扇出（fan-out）——每个用户的关注者数量分布极不均匀。一个拥有数千万粉丝的名人发布一条推文，会瞬间触发数千万次写入。因此，“每个用户的关注者数量分布”才是描述其系统负载的关键参数。但故事并未就此结束。在方法2稳定运行后，Twitter转向了一种混合方法。对于绝大多数普通用户，系统继续采用写时扇出；但对于少数拥有海量粉丝的名人（例如明星），系统则不再进行扇出。当用户读取主页时间线时，系统会单独拉取其关注的名人推文，并与缓存中的普通推文合并。这个演进揭示了一个更深刻的道理：一个真正可扩展的系统，可能需要多种共存的策略，以应对不同分段的负载特征。不存在所谓的“神奇扩展酱汁”，在一个应用中行之有效的扩展策略，在另一个应用中可能完全适得其反。 -------------------------------------------------------------------------------- 3. 世上没有“无模式”，只有“读时模式” “无模式（Schemaless）”是文档数据库（如 MongoDB）流行时的一个热门词汇，它似乎意味着开发者可以摆脱关系型数据库中僵化的模式（schema）束缚。但 DDIA 揭示了这其实是一种误解。书中提出了两个更精确的概念来描述数据模式的应用方式：写时模式（Schema-on-write）: 这是传统关系型数据库的模式。Schema 是明确定义的，数据库会强制所有写入的数据都必须遵守这个模式。读时模式（Schema-on-read）: 这是文档数据库采用的方式。数据的结构是隐式的，只有在数据被读取时，才由代码来解释和处理。这里的核心洞察是：模式并未消失，它只是从数据库转移到了应用程序代码中。当你的代码从文档数据库中读取数据时，它必然会假设数据具有某种结构（比如，存在一个名为 userName 的字段）。这种假设，就是一种隐式的模式。例如，假设你决定将用户数据中的 full_name 字段拆分为 first_name 和 last_name。在读时模式的系统中，你只需开始写入包含新字段的新文档，同时在应用程序中加入处理旧格式文档（仍包含 full_name）的逻辑。书中使用了一个绝佳的类比：写时模式就像编程语言中的静态类型检查（在编译时检查），而读时模式则像动态类型检查（在运行时检查）。这个区别至关重要，因为它提醒我们，一个由应用程序代码维护的隐式模式，可能比数据库强制的显式模式更难管理和推理，尤其是在应用不断演进、数据结构需要变更的情况下。 -------------------------------------------------------------------------------- 4. 复制延迟可能导致“时间倒流” 在主从（leader-follower）架构的数据库中，为了性能，通常采用异步复制。这意味着从库的数据会比主库稍微延迟一些，这种现象被称为复制延迟（replication lag）。我们通常认为这只是一种短暂的不一致，但它却可能给用户带来匪夷所思的诡异体验。书中用单调读（monotonic reads）保证来解释这个现象。想象这样一个场景：一个用户在一个网站上发表了一条评论（写入主库）。他立刻刷新页面，请求被路由到一个同步及时的从库，他看到了自己的评论。他再次刷新页面，这次请求被路由到了一个有延迟的从库。由于评论数据还没同步过来，他发现自己刚刚发表的评论……消失了！从用户的视角来看，时间仿佛倒流了。他亲眼目睹了自己创造的东西凭空消失。如果用户2345先是看到用户1234的评论出现，然后又看到它再次消失，这对用户来说会非常困惑。这个例子深刻地揭示了“最终一致性”并不是一个可以轻描淡写的概念。它会带来真实世界中的异常现象，系统设计者必须仔细考虑如何通过架构设计来缓解这些问题，以保证良好的用户体验。 -------------------------------------------------------------------------------- 5. “最后写入者获胜”通常是“最后写入者弄丢数据” **最后写入者获胜（Last Write Wins, LWW）**是一种在分布式数据库（如 Cassandra）中非常流行的冲突解决策略。当多个客户端同时写入同一个键时，LWW 会简单地根据时间戳来决定哪一次写入是“最新的”，并保留它，丢弃其他的。这听起来很合理，但却隐藏着致命的缺陷。问题根源在于不可靠的时钟。分布式系统中的不同节点，其物理时钟几乎不可能完全同步，总会存在一定的偏差（skew）。假设有两个客户端，客户端A先写入 x=1，然后客户端B在看到 x=1 后再写入 x=2。这是一个有明确因果关系的顺序操作。然而，由于客户端B的机器时钟比客户端A慢了不到3毫秒，它给 x=2 这次写入赋予的时间戳反而比 x=1 的时间戳更早。当副本节点收到这两次写入时，它会根据时间戳错误地判断 x=1 是“最后”的写入，而 x=2 这次本应保留的、正确的写入，就被悄无声息地丢弃了。数据丢失就这样发生了。 LWW 的问题还不止于此。当两个节点的时钟分辨率只有毫秒级时，它们完全可能独立地生成具有相同时间戳的写入。为了解决冲突，系统需要一个额外的“决胜值”（tiebreaker，可以是一个大的随机数），但这种方法同样可能违反因果关系，导致数据丢失。 LWW 确实能让所有副本最终收敛到一致的状态，但这是以牺牲持久性（durability）为代价的。对于任何无法接受数据丢失的应用来说，LWW 都是一个糟糕的选择。这个认知提醒我们，基于时间戳的排序，并不等同于基于因果关系的排序。 -------------------------------------------------------------------------------- 6. 未来是“数据库的解体” 观察现代数据系统的架构，我们很少会发现只使用单一数据库的情况。更常见的模式是组合使用多种专用系统：用一个关系型数据库作为权威数据源（system of record），用 Elasticsearch 提供搜索功能，用 Redis 作为缓存，用数据仓库进行分析…… DDIA 将这种架构模式提炼为一个深刻的概念：数据库的解体（unbundling of databases）。这个类比非常精妙：一个传统的关系型数据库，实际上将存储引擎与各种衍生数据结构（如二级索引、物化视图）紧密地捆绑在了一起。而“解体”的架构，通过将这些功能拆分到不同的专用系统中，并通过一个异步事件日志（如 Kafka）将它们连接起来，实现了同样的目标。权威数据源（如 PostgreSQL）通过变更数据捕获（Change Data Capture, CDC）产生一个变更事件流。流处理器消费这个事件流，创建并维护各种衍生数据系统，比如搜索索引、缓存、数据仓库等。这正是 Unix 哲学在数据系统领域的应用：用一系列小而专的工具，每个工具只做一件事并把它做好，然后将它们组合成一个更强大的系统。从这个角度看，批处理器和流处理器就像是触发器、存储过程和物化视图维护程序的复杂实现。它们所维护的衍生数据系统，则像是不同类型的索引。这种以数据流为中心的架构，其目标并非在特定工作负载上超越单个数据库的性能，那是一种“过早优化”。它的真正目标是通过组合多个不同的数据库，来为远比单一软件所能处理的、更广泛的工作负载范围提供良好的性能。这种架构牺牲了集成系统的便利性，换来了处理更广泛、更不可预测的未来需求的灵活性和弹性，使系统变得从根本上更易于演进。 -------------------------------------------------------------------------------- 总结从“平均值”指标的欺骗性，到“无模式”数据库背后隐藏的契约，再到“最后写入者获胜”策略下的数据丢失风险，这些认知都指向一个核心主题：构建健壮的数据系统，要求我们必须深入地质疑自己的假设，并理解支配这些系统的基本原理。DDIA 这本书的伟大之处，就在于它系统性地为我们揭示了这些原理。读完这些，不妨反思一下：在你的系统中，你认为理所当然的哪个假设，实际上可能是一个隐藏的负债？

392

Tom Cao@tomcaokol35578 · Oct 17

苏格拉底：知足是天然的财富，欲望是人为的贫穷。🤣🤣 真正的富足，是既能像庄子般“逍遥于天地之间”，又能如浮士德般永葆“停下吧，你真美”的清醒。知足与欲望本是一体两面——知足让我们锚定当下，适度的欲望则推动人类文明向前。二者的平衡，恰是生命艺术的精妙所在。

116

Most engaged tweets of Tom Cao

Tom Cao@tomcaokol35578 · Oct 26

91k

Tom Cao@tomcaokol35578 · Nov 07

成功的6个承诺！

Tom Cao@tomcaokol35578 · Oct 17

每个工作日的中午我都喜欢避开热闹的食堂，到公司楼下的院子里静静的呆着，然后小憩一下，让自己闲下来。

496

Tom Cao@tomcaokol35578 · Nov 02

安卓+windows 拿头来打 mac+iphone+airpods+iwatch+ipad+美区id+icloud+carplay+siri？

191

Tom Cao@tomcaokol35578 · Oct 15

色戒真的进去了吗

Tom Cao@tomcaokol35578 · Oct 18

这让我一千万上车深圳前海房产有点冤大头的感觉，只能安慰自己当成核心资产吧，不过没亏本还涨了点。

610

Tom Cao@tomcaokol35578 · Oct 20

在AI时代：你的大脑应该解放出来，专注于无法被外包的、高级的认知活动。记住一个原则：大脑是用来“想事”的，不是用来“记事”的。 Obsidian是你的“第二大脑”或“思维工作室”，它记录的是你将外部信息（包括AI提供的）内化的过程。 AI是你的信息助理、写作助理和头脑风暴伙伴，负责处理具体、琐碎、需要快速响应的信息任务。

Tom Cao@tomcaokol35578 · Oct 19

想问下大家的看法，外接多屏显示器真的能提高工作效率吗

Tom Cao@tomcaokol35578 · Oct 19

复利的力量：如果你在 1925 年购买了黄金，按照不断复利来计算，你会获得一笔惊人的财富！并且与此同时，在今天你就。。。可能已经去世了。🤣🤣

Tom Cao@tomcaokol35578 · Oct 24

谁说起号要去大v下面留言抬杠的，得罪好几个了，粉丝涨的也不快啊。🤣🤣 被我抬杠的大哥们，我错了！别和我一般见识！

178

这个思路是错的。AI 越强，‘拼时长’越没有意义。下一阶段是：AI 负责执行（卷），人类负责‘异想天开’（浪）。谁还在跟 AI 拼‘不睡觉’，谁就是第一批被淘汰的‘数字劳工’。

粉丝到达500-1000后，将开始持续输出核心观点，欢迎各位有趣的灵魂关注呀。🤣🤣

388

People with Analyst archetype

Angus.ETH@angustias87

Full-time Trader | Technical + On-chain Analysis Spotting narratives before they pump Sharing setups, market psychology & trading strategies

291 following397 followers

Jayeon Choi Ⓜ️Ⓜ️T@nature312

I'm very interested in the crypto and launchzone markets and the ecosystem in them #mintBase #ISLM_MAXI $FAR

1k following605 followers

daniel@danielhangan_

anti ai slop $4/vid Real UGC @dansugcmodels Clippers you can trust clippersdb.com Tiktok VPN dansvpn.com Ambassador @windsurf

1k following2k followers

Keno@kenodnb

Sniffing in DeFi 24/7. A Golden Retriever on the path to wealth. I love kibbles with Maple $SYRUP.

823 following8k followers

Dexter's Lab@DextersSolab

𝟐𝟎𝟎 𝐈𝐐 𝐃𝐞𝐠𝐞𝐧 • 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝗶𝗼𝗻 𝗠𝗮𝗿𝗸𝗲𝘁𝘀 𝗔𝗻𝗮𝗹𝘆𝘀𝘁 • 𝗕𝗹𝘂𝗲𝗰𝗵𝗶𝗽 𝗛𝗼𝗹𝗱𝗲𝗿 𝐏𝐫𝐢𝐧𝐭𝐢𝐧𝐠 𝐝𝐚𝐢𝐥𝐲, 𝐬𝐮𝐛𝐬𝐜𝐫𝐢𝐛𝐞

263 following5k followers

Onat_Fawaz 👽@CryptOnat__

🚀 Crypto Enthusiast | 📊 Charting the Future of Finance | 💡 Insights & Strategies | 🌍 Navigating Web3 | 🌱 Always Learning, Always Growing 💎✨

3k following3k followers

Will Bunting@will_bunting_

Caltech Physics → Stripe Staff → stealth (data + AI) | Notes from the edge | Tokyo 🇯🇵

295 following501 followers

TriDung_BNB | DeFi@TD_bbboys258

In times of crisis, money plus courage is priceless. Winners do not resist change but adapt to the trend!

1k following1k followers

S Li@YanyuRensheng

@aivron_ai 多模型接入、团队记忆、共享上下文

1k following1k followers

4REIGN@4reigntech

TRULY HUMBLE UNDER GOD

1k following1k followers

Ema26❤️@jack33336666

Certified heartbreaker 💔 (by accident, I swear)

2k following1k followers