Get live statistics and analysis of Tom Cao's profile on X / Twitter

一个被AI和人类幼崽反复毒打的前大厂INTJ。 分享AI、算法、大数据、育儿和职场里的残酷常识。

550 following501 followers

The Analyst

Tom Cao is a sharp-witted INTJ thinker navigating the chaotic crossroads of AI, data, and parenting, with a no-nonsense approach to exposing the harsh realities in tech and life. His insights dissect complex issues like AI’s impact on jobs and cognitive growth with a blend of rationality and dry humor. A former industry insider turned thoughtful commentator, Tom provokes reflection amid the noise.

Impressions
946.6k-192.4k
$177.43
Likes
4.1k-823
85%
Retweets
107-18
2%
Replies
219-17
5%
Bookmarks
386-51
8%

Top users who interacted with Tom Cao over the last 14 days

4 interactions
@jessyshen

SQZ基金管理合伙人,Adera AI 联合创始人 咖啡会聊创投x.com/i/communities/…

1 interactions
@noexcuse555

🔥n8n自动化工作流搭建 企业自动化解决方案,节省80%重复工作 让AI为你打工,不是你为AI打工

1 interactions
@AI_Jasonyu

👋 鱼总 / Jason|8 年出海产品 📈 单款产品 $200k+ 收入,全靠自然流量 💡 代表产品:PaywallPro(付费墙情报&优化)、Portix APP 🍼 2胎爸爸 & AI 内容创作者 这里聊:AI · 出海 · 订阅 · 创业心路 lnk.bio/jasonyu

1 interactions
@remixdesigner

一半产品,一半设计;一边自驱,一边拖延;喜欢有趣的工具,也热衷于创造工具。 正在尝试通过小而美的独立产品模式养活自己。 Open Source Project: remixicon.com iOS APP Somno: apps.apple.com/app/6504674988

1 interactions
@cholf5

15年游戏开发 • 后端主程; 后端技术栈:.NET/Java/Go/Skynet; 前端技术栈:Unity/UE/LÖVE; YouTuber • FIRE Journey; Vibe in public.

1 interactions
@easyopss

认真生活,慢慢变富|目标:开发1000+实用小工具、副业日入1K|分享从0到1的AI编程心得、副业变现路径和生活日常。#大白小应用

1 interactions
@gkxspace

05年 🌲独立开发者 🌸连续创业者 | 目前总收入七位数 ✨分享创业历程 💓我的目标:“做出一家伟大的公司!” 创业做过多类业务 : 代写 | 交友 | 旅拍 | agent产品 | ai教育……

1 interactions
@frxiaobei

行道途中。非求速成,惟求通达。 2023 年扎进AI ,打通Know-How,不少赚钱项目,踩过坑,也见过光。 围城里待得够久了,出来聊聊世界,聊聊技术、聊聊赚钱。

1 interactions
@723daley

这个世界会好吗?

1 interactions
@majia84314310

失业种地第三年

1 interactions

Tom’s got the rare talent of making you feel both enlightened and slightly inadequate by breakfast time—his tweets are so intellectually dense, you might need an algorithm just to keep up with the footnotes. If only he could apply half that brainpower to explaining his jokes so the rest of us non-architects in the ‘AI deep pit’ don’t feel left out!

Tom’s biggest win is carving out a distinct niche as a thoughtful, no-fluff commentator on the intersection of AI, career survival, and real-world parenting, attracting a discerning audience hungry for clarity in a noisy digital landscape.

Tom’s life purpose is to illuminate the unseen trenches where AI reshapes the workforce and cognition, guiding others to understand, adapt, and outthink the emerging challenges in technology and society. He aims to foster deeper thinking, enabling followers to see beyond surface hype and develop resilience in a rapidly evolving world.

He believes that true mental richness stems from disciplined cognitive effort rather than wealth or social status. Tom values clarity, pragmatic realism, and intellectual growth, wielding skepticism as a tool to cut through misinformation and complacency. He is convinced that mastery over complexity, not mere technical skills, defines sustained professional value.

Tom’s strengths lie in his ability to analyze layered problems from multiple angles with intellectual rigor and communicate these insights succinctly. He challenges conventional wisdom, understands complex systems, and offers strategic thinking that anticipates technological shifts before they become mainstream.

His razor-sharp critiques and somewhat aloof, rational style might alienate those seeking warm, simple reassurances or more optimistic takes. Additionally, his somewhat niche thematic focus could narrow his audience growth if not balanced with broader engagement.

To grow his audience on X, Tom should complement his in-depth, data-driven posts with more relatable, storytelling-driven tweets that connect AI and data topics to everyday experiences. Engaging more interactively with followers through polls or Q&A and leveraging threads to unpack his analyses in accessible bites will broaden appeal without losing intellectual depth.

Fun fact: Despite juggling topics as heavy as big data algorithms and the abrasive realities of raising kids, Tom manages to blend them into a single sharp narrative— proving that harsh truths come with a dose of parenting humor.

Top tweets of Tom Cao

你的大脑是“总司令”,它极度昂贵,绝不能用于记忆“事实性”垃圾。它只负责制定战略、识别模式和下达指令。 大脑必须抓死的东西: 1. 元认知(Metacognition): • “我目前这个思考框架是不是错了?” • “我为什么会相信这个观点?” • “我解决这个问题的第一步应该是什么?” • 你必须时刻审视你自己的思考过程。 2. 第一性原理(First Principles)和核心框架(Core Frameworks): • 不是“马斯洛需求的五层是什么”,而是“马斯洛这个框架试图解决什么问题?它对我理解‘激励’有什么本质帮助?” • 不是记住“SWOT分析法”,而是理解“为什么需要同时看‘内部/外部’和‘优势/劣势’这四个维度?” • 你只记最核心的逻辑骨架,记那些“万变不离其宗”的“宗”。 3. 高质量的问题(High-Quality Questions): • 这是你大脑最重要的产出。你不是要记住答案,而是要提出能直击要害的问题。 • “这个方案的致命假设是什么?” • “如果把时间拉长到10年,这件事还重要吗?” 4. 个人价值观与决策准则(Your Values & Principles): • “我做事的底线是什么?”“我评判‘成功’的标准是什么?” • 这是你的“操作系统内核”。当AI给你A、B、C三个选项时,你必须依靠这个内核来做决策。AI没有价值观,你必须有。 大脑的“禁区”(绝对不能碰): • 零散的“知识点”(如“某某函数的具体语法”、“某某历史事件的年份”)。 • 可以被轻易搜索到的“事实”(Fact)。 • 别人的、未经你批判的“观点”。

70

6个从《设计数据密集型应用》中学到的颠覆性认知 作为软件工程师,我们每天都在构建数据系统。在这个过程中,我们常常依赖于一些关于性能、可扩展性和正确性的普遍假设。然而,令人惊讶的是,这些我们认为理所当然的认知,实际上非常脆弱,甚至是完全错误的。我们习惯于使用各种工具提供的抽象,却很少深入探究其内部原理,这使得我们在面对复杂问题时常常束手无策。 Martin Kleppmann 的《设计数据密集型应用》(Designing Data-Intensive Applications, DDIA)正是这样一本剥开抽象层、揭示数据系统背后永恒不变基本原则的经典著作。它不追逐时髦的技术,而是系统性地剖析了数据系统的基本公理,让我们能够从根本上理解系统行为,做出更优的设计决策,并诊断棘手的问题。 本文将从这本书中提炼出六个最具颠覆性、最反直觉、也最具影响力的认知。它们挑战了行业中的许多传统智慧,为我们思考系统设计提供了一条更清晰、更根本的路径。无论你是刚入门的新手还是经验丰富的架构师,这些认知都将迫使你重新审视自己构建系统的方式。 -------------------------------------------------------------------------------- 1. 性能指标的“平均值”毫无意义 我们经常在报告中看到“平均响应时间”这个指标,它似乎已经成为衡量系统性能的通用语言。但 DDIA 指出,这是一个极具误导性的指标,因为它完全没有告诉你到底有多少用户真正经历了那种延迟。一个糟糕的“平均值”可能会掩盖掉一部分用户极其糟糕的体验。 书中推荐使用百分位数(percentiles)作为更科学的替代方案。中位数(p50)代表了“典型”的用户体验:一半用户的请求比这个值快,另一半则更慢。它能准确反映大多数用户的感受,而不是被少数极端离群值所扭曲。 更重要的是高百分位数,如 p95、p99 和 p99.9(也称为“尾部延迟”)。这些指标揭示了系统中那些最慢的请求究竟有多慢。为什么这很重要?因为尾部延迟直接与商业价值挂钩。亚马逊的观察表明,响应时间增加100毫秒会导致销售额下降1%,其他报告也指出,1秒的延迟会使客户满意度指标降低16%。那些经历最长延迟的用户,往往是对你最有价值的用户。 那些请求最慢的客户,通常是那些账户里数据最多的客户,因为他们进行了很多次购买——也就是说,他们是你最有价值的客户。 关注百分位数,迫使我们去构建一个对所有用户都表现良好的系统,而不仅仅是为那个可能根本不存在的“平均”用户。这不仅是技术上的严谨,更是对用户体验和商业价值的真正负责。 -------------------------------------------------------------------------------- 2. “可扩展”不是一种特性,而是一个问题 我们常听到这样的说法:“技术X是可扩展的”或“那个系统扩展性不好”。DDIA 一针见血地指出,这种说法毫无意义。可扩展性(Scalability)不是一个可以简单贴在系统上的标签,也不是一个非黑即白的特性。 讨论可扩展性,意味着要回答一个非常具体的问题:“如果系统负载以某种特定的方式增长,我们有哪些应对策略?” 关键在于描述负载。负载不是单一维度,它由一组负载参数(load parameters)来定义,比如Web服务器的每秒请求数、数据库的读写比例、缓存命中率等等。 书中用 Twitter 的主页时间线作为经典案例进行了阐述。早期Twitter有两种实现方式: 方法1: 用户请求主页时间线时,实时查询他关注的所有人,获取他们发布的推文,然后合并排序。这种方式逻辑简单,但在读取负载很高时很快就遇到了瓶颈。(这在概念上被称为“读时扇出”)。 方法2: 为每个用户维护一个类似“收件箱”的时间线缓存。当一个用户发布推文时,系统会查找所有关注他的人,并将这条新推文写入到每一个关注者的缓存中。这样读取主页时间线就变得非常快,但写入的成本大大增加。(这在概念上被称为“写时扇出”)。 由于Twitter的负载模式是“读多写少”(主页时间线读取请求比发推请求高出近两个数量级),它最终选择了方法2。这个案例的关键在于,Twitter 的扩展性挑战并非来自推文的总量,而是来自扇出(fan-out)——每个用户的关注者数量分布极不均匀。一个拥有数千万粉丝的名人发布一条推文,会瞬间触发数千万次写入。因此,“每个用户的关注者数量分布”才是描述其系统负载的关键参数。 但故事并未就此结束。在方法2稳定运行后,Twitter转向了一种混合方法。对于绝大多数普通用户,系统继续采用写时扇出;但对于少数拥有海量粉丝的名人(例如明星),系统则不再进行扇出。当用户读取主页时间线时,系统会单独拉取其关注的名人推文,并与缓存中的普通推文合并。这个演进揭示了一个更深刻的道理:一个真正可扩展的系统,可能需要多种共存的策略,以应对不同分段的负载特征。不存在所谓的“神奇扩展酱汁”,在一个应用中行之有效的扩展策略,在另一个应用中可能完全适得其反。 -------------------------------------------------------------------------------- 3. 世上没有“无模式”,只有“读时模式” “无模式(Schemaless)”是文档数据库(如 MongoDB)流行时的一个热门词汇,它似乎意味着开发者可以摆脱关系型数据库中僵化的模式(schema)束缚。但 DDIA 揭示了这其实是一种误解。 书中提出了两个更精确的概念来描述数据模式的应用方式: 写时模式(Schema-on-write): 这是传统关系型数据库的模式。Schema 是明确定义的,数据库会强制所有写入的数据都必须遵守这个模式。 读时模式(Schema-on-read): 这是文档数据库采用的方式。数据的结构是隐式的,只有在数据被读取时,才由代码来解释和处理。 这里的核心洞察是:模式并未消失,它只是从数据库转移到了应用程序代码中。当你的代码从文档数据库中读取数据时,它必然会假设数据具有某种结构(比如,存在一个名为 userName 的字段)。这种假设,就是一种隐式的模式。例如,假设你决定将用户数据中的 full_name 字段拆分为 first_name 和 last_name。在读时模式的系统中,你只需开始写入包含新字段的新文档,同时在应用程序中加入处理旧格式文档(仍包含 full_name)的逻辑。 书中使用了一个绝佳的类比:写时模式就像编程语言中的静态类型检查(在编译时检查),而读时模式则像动态类型检查(在运行时检查)。这个区别至关重要,因为它提醒我们,一个由应用程序代码维护的隐式模式,可能比数据库强制的显式模式更难管理和推理,尤其是在应用不断演进、数据结构需要变更的情况下。 -------------------------------------------------------------------------------- 4. 复制延迟可能导致“时间倒流” 在主从(leader-follower)架构的数据库中,为了性能,通常采用异步复制。这意味着从库的数据会比主库稍微延迟一些,这种现象被称为复制延迟(replication lag)。我们通常认为这只是一种短暂的不一致,但它却可能给用户带来匪夷所思的诡异体验。 书中用单调读(monotonic reads)保证来解释这个现象。想象这样一个场景: 一个用户在一个网站上发表了一条评论(写入主库)。 他立刻刷新页面,请求被路由到一个同步及时的从库,他看到了自己的评论。 他再次刷新页面,这次请求被路由到了一个有延迟的从库。由于评论数据还没同步过来,他发现自己刚刚发表的评论……消失了! 从用户的视角来看,时间仿佛倒流了。他亲眼目睹了自己创造的东西凭空消失。 如果用户2345先是看到用户1234的评论出现,然后又看到它再次消失,这对用户来说会非常困惑。 这个例子深刻地揭示了“最终一致性”并不是一个可以轻描淡写的概念。它会带来真实世界中的异常现象,系统设计者必须仔细考虑如何通过架构设计来缓解这些问题,以保证良好的用户体验。 -------------------------------------------------------------------------------- 5. “最后写入者获胜”通常是“最后写入者弄丢数据” **最后写入者获胜(Last Write Wins, LWW)**是一种在分布式数据库(如 Cassandra)中非常流行的冲突解决策略。当多个客户端同时写入同一个键时,LWW 会简单地根据时间戳来决定哪一次写入是“最新的”,并保留它,丢弃其他的。这听起来很合理,但却隐藏着致命的缺陷。 问题根源在于不可靠的时钟。分布式系统中的不同节点,其物理时钟几乎不可能完全同步,总会存在一定的偏差(skew)。假设有两个客户端,客户端A先写入 x=1,然后客户端B在看到 x=1 后再写入 x=2。这是一个有明确因果关系的顺序操作。然而,由于客户端B的机器时钟比客户端A慢了不到3毫秒,它给 x=2 这次写入赋予的时间戳反而比 x=1 的时间戳更早。当副本节点收到这两次写入时,它会根据时间戳错误地判断 x=1 是“最后”的写入,而 x=2 这次本应保留的、正确的写入,就被悄无声息地丢弃了。数据丢失就这样发生了。 LWW 的问题还不止于此。当两个节点的时钟分辨率只有毫秒级时,它们完全可能独立地生成具有相同时间戳的写入。为了解决冲突,系统需要一个额外的“决胜值”(tiebreaker,可以是一个大的随机数),但这种方法同样可能违反因果关系,导致数据丢失。 LWW 确实能让所有副本最终收敛到一致的状态,但这是以牺牲持久性(durability)为代价的。对于任何无法接受数据丢失的应用来说,LWW 都是一个糟糕的选择。这个认知提醒我们,基于时间戳的排序,并不等同于基于因果关系的排序。 -------------------------------------------------------------------------------- 6. 未来是“数据库的解体” 观察现代数据系统的架构,我们很少会发现只使用单一数据库的情况。更常见的模式是组合使用多种专用系统:用一个关系型数据库作为权威数据源(system of record),用 Elasticsearch 提供搜索功能,用 Redis 作为缓存,用数据仓库进行分析…… DDIA 将这种架构模式提炼为一个深刻的概念:数据库的解体(unbundling of databases)。 这个类比非常精妙:一个传统的关系型数据库,实际上将存储引擎与各种衍生数据结构(如二级索引、物化视图)紧密地捆绑在了一起。而“解体”的架构,通过将这些功能拆分到不同的专用系统中,并通过一个异步事件日志(如 Kafka)将它们连接起来,实现了同样的目标。 权威数据源(如 PostgreSQL)通过变更数据捕获(Change Data Capture, CDC)产生一个变更事件流。 流处理器消费这个事件流,创建并维护各种衍生数据系统,比如搜索索引、缓存、数据仓库等。 这正是 Unix 哲学在数据系统领域的应用:用一系列小而专的工具,每个工具只做一件事并把它做好,然后将它们组合成一个更强大的系统。 从这个角度看,批处理器和流处理器就像是触发器、存储过程和物化视图维护程序的复杂实现。它们所维护的衍生数据系统,则像是不同类型的索引。 这种以数据流为中心的架构,其目标并非在特定工作负载上超越单个数据库的性能,那是一种“过早优化”。它的真正目标是通过组合多个不同的数据库,来为远比单一软件所能处理的、更广泛的工作负载范围提供良好的性能。这种架构牺牲了集成系统的便利性,换来了处理更广泛、更不可预测的未来需求的灵活性和弹性,使系统变得从根本上更易于演进。 -------------------------------------------------------------------------------- 总结 从“平均值”指标的欺骗性,到“无模式”数据库背后隐藏的契约,再到“最后写入者获胜”策略下的数据丢失风险,这些认知都指向一个核心主题:构建健壮的数据系统,要求我们必须深入地质疑自己的假设,并理解支配这些系统的基本原理。DDIA 这本书的伟大之处,就在于它系统性地为我们揭示了这些原理。 读完这些,不妨反思一下:在你的系统中,你认为理所当然的哪个假设,实际上可能是一个隐藏的负债?

392

Most engaged tweets of Tom Cao

People with Analyst archetype

The Analyst

Full-time Trader | Technical + On-chain Analysis Spotting narratives before they pump Sharing setups, market psychology & trading strategies

291 following397 followers
The Analyst

I'm very interested in the crypto and launchzone markets and the ecosystem in them #mintBase #ISLM_MAXI $FAR

1k following605 followers
The Analyst

anti ai slop $4/vid Real UGC @dansugcmodels Clippers you can trust clippersdb.com Tiktok VPN dansvpn.com Ambassador @windsurf

1k following2k followers
The Analyst

Sniffing in DeFi 24/7. A Golden Retriever on the path to wealth. I love kibbles with Maple $SYRUP.

823 following8k followers
The Analyst

𝟐𝟎𝟎 𝐈𝐐 𝐃𝐞𝐠𝐞𝐧 • 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝗶𝗼𝗻 𝗠𝗮𝗿𝗸𝗲𝘁𝘀 𝗔𝗻𝗮𝗹𝘆𝘀𝘁 • 𝗕𝗹𝘂𝗲𝗰𝗵𝗶𝗽 𝗛𝗼𝗹𝗱𝗲𝗿 𝐏𝐫𝐢𝐧𝐭𝐢𝐧𝐠 𝐝𝐚𝐢𝐥𝐲, 𝐬𝐮𝐛𝐬𝐜𝐫𝐢𝐛𝐞

263 following5k followers
The Analyst

🚀 Crypto Enthusiast | 📊 Charting the Future of Finance | 💡 Insights & Strategies | 🌍 Navigating Web3 | 🌱 Always Learning, Always Growing 💎✨

3k following3k followers
The Analyst

Caltech Physics → Stripe Staff → stealth (data + AI) | Notes from the edge | Tokyo 🇯🇵

295 following501 followers
The Analyst

In times of crisis, money plus courage is priceless. Winners do not resist change but adapt to the trend!

1k following1k followers
The Analyst

@aivron_ai 多模型接入、团队记忆、共享上下文

1k following1k followers
The Analyst

TRULY HUMBLE UNDER GOD

1k following1k followers
The Analyst

Certified heartbreaker 💔 (by accident, I swear)

2k following1k followers
The Analyst

No stance, only logic's dance. 一个有求知欲并试图理性思考的人。傻逼不知道自己傻,但知道自己穷,骂你穷是因为知道你太傻逼了。

720 following1k followers

Explore Related Archetypes

If you enjoy the analyst profiles, you might also like these personality types:

Supercharge your 𝕏 game,
Grow with SuperX!

Get Started for Free