Quay lại
Read in English

Hành Trình AI Của Tôi: Từ Lagrange Đến LLMs

Hơn một thập kỷ với AI — từ đọc sách giáo khoa về nhân tử Lagrange để hiểu SVM, đến xây dựng KyberAI, đến vibe coding trang web này. Mỗi thời kỳ đều như đỉnh cao. Mỗi thời kỳ chỉ là khởi đầu.

Mọi người đôi khi gọi tôi là "Long AI" hay "Cha đẻ KyberAI." Nghe thì hay, nhưng sự thật thú vị hơn: mối quan hệ của tôi với AI kéo dài hơn một thập kỷ, xuyên suốt mọi giai đoạn phát triển của lĩnh vực này. Mỗi khoảnh khắc đều cảm giác như đã đạt đỉnh cao. Mỗi lần, đó chỉ là khởi đầu.

2014: Kỷ Nguyên Lagrange

Lần đầu tiên tôi tiếp xúc nghiêm túc với AI không hề hào nhoáng. Tôi là sinh viên, và tôi muốn hiểu Support Vector Machines và K-means clustering — không chỉ sử dụng, mà thực sự hiểu chúng.

Vì vậy tôi làm điều mà bất kỳ người học ám ảnh nào cũng làm: đọc cả một cuốn sách về nhân tử Lagrange.

Đây là trước khi AI trở nên "cool." Trước khi "kỹ sư machine learning" là một chức danh. Trước khi ai nói về "AI safety" hay "AGI timelines." Chỉ là toán học — toán học đẹp đẽ, nền tảng, sẽ chi phối mọi thứ sau này.

Nhìn lại, khoản đầu tư đó sinh lời theo cách tôi không thể tưởng tượng. Khi bạn hiểu lý thuyết tối ưu hóa đằng sau SVMs, bạn phát triển trực giác về cách các mô hình học. Trực giác đó chuyển giao qua các mô hình khác nhau.

2017: Khi AI "Không Hoạt Động"

Đến 2017, tôi bắt đầu cộng tác từ xa với một startup AI tại Việt Nam. NLP là trọng tâm, và nó... khá thô.

Tôi vẫn nhớ những cuộc tranh luận. Các kỹ sư tranh luận đầy nhiệt huyết rằng thuật toán thủ công của họ vượt trội mọi phương pháp ML cho named entity recognition. Và đây là điều: họ đúng. Vào thời điểm đó, các hệ thống dựa trên luật được tinh chỉnh cẩn thận thường thắng các phương pháp neural cho các tác vụ cụ thể.

Thật là một thời đại để sống.

Những cuộc tranh luận đó dạy tôi điều quan trọng: hoài nghi AI là lành mạnh. Lĩnh vực này luôn có nhiều hype hơn thực chất tại bất kỳ thời điểm nào. Nhưng những người hoài nghi mắc một sai lầm nghiêm trọng — họ đánh giá thấp tiến bộ tích lũy.

Các hệ thống NER dựa trên luật thắng mạng neural năm 2017? Giờ là đồ cổ. Các kỹ sư xây dựng chúng từ lâu đã chuyển sang tín đồ deep learning. Tiến bộ trong AI không tuyến tính — nó theo cấp số nhân, xen kẽ các bước nhảy mô hình.

2017-2020: Tiến sĩ — Phi Tập Trung Gặp Machine Learning

Nghiên cứu Tiến sĩ của tôi tại UTT/Montimage/INRIA tập trung vào điều có vẻ bí truyền lúc đó: áp dụng machine learning vào bảo mật mạng phân tán trong Named Data Networking.

Nhưng đây là điều thú vị. Trong khi mọi người tập trung vào cách ML có thể giúp mạng, tôi phát hiện điều ngược lại: hiệu ứng mạng có thể cải thiện machine learning.

Tôi phân rã các hàm Bayesian Network thành lambda calculus — một bài tập lý thuyết có vẻ thuần học thuật. Ý tưởng là thiết bị IoT có thể chia sẻ tính toán thay vì chạy lại mọi thứ từ đầu. Với sự trỗi dậy của edge computing và federated learning, những ý tưởng này đang trở nên liên quan trở lại.

Công việc này cũng tiết lộ sợi chỉ kết nối mọi thứ tôi làm: phi tập trung. Tiến sĩ: bảo mật mạng phi tập trung. DeFi: tài chính phi tập trung. Điểm chung không chỉ là công nghệ — mà là tin tưởng hệ thống thay vì người gác cổng.

2021-Nay: Nghiên Cứu DeFi tại Kyber Network

Khi tôi gia nhập Kyber Network năm 2021, tôi bắt đầu với vai trò nghiên cứu viên, khám phá các giao thức DeFi, AMM và aggregators. Năm 2022, tôi trở thành Research Lead, đảm nhận trách nhiệm lớn hơn cho chiến lược nghiên cứu và lãnh đạo đội ngũ.

Nhưng tôi không thể thoát khỏi AI.

Năm 2023, tôi dẫn dắt phát triển KyberAI cùng đội ngũ — hệ thống áp dụng machine learning vào dữ liệu on-chain để giúp trader DeFi đưa ra quyết định sáng suốt. KyberScore sử dụng cả tín hiệu on-chain và phân tích kỹ thuật off-chain để dự đoán hiệu suất token ngắn hạn. Đồng nghiệp đùa gọi tôi là "Cha đẻ KyberAI" hay đơn giản "Long AI."

KyberAI cuối cùng ngừng hoạt động vào tháng 12/2023, nhưng bài học vẫn còn. Xây dựng sản phẩm ML không chỉ về độ chính xác mô hình — mà về hiểu nhu cầu người dùng, pipeline dữ liệu, và toàn bộ hệ sinh thái.

Năm 2025, tôi đảm nhận sở hữu dữ liệu: xây dựng hạ tầng dữ liệu của công ty từ đầu cùng một đội nhỏ, chuyển từ nguồn bên thứ ba không ổn định sang pipeline nội bộ, và hỗ trợ ra mắt các sản phẩm lớn. Công việc hàng ngày của tôi giờ trải dài sở hữu sản phẩm dữ liệu, phân tích và hỗ trợ nghiên cứu.

2023: Khoảnh Khắc Sputnik

Rồi ChatGPT xuất hiện.

Tôi đã ở trong lĩnh vực này đủ lâu để hoài nghi các chu kỳ hype. Tôi đã thấy "mùa đông AI" và "mùa xuân AI." Nhưng lần này khác. Kiến trúc transformer, mở rộng lên hàng tỷ tham số, huấn luyện trên văn bản internet — nó cảm giác như một chuyển pha thực sự.

Tôi xây dựng hết dự án cá nhân này đến dự án khác. Không phải vì cần, mà vì cần hiểu. Các mô hình này thực sự hoạt động như thế nào? Các failure modes là gì? Ranh giới khả năng của chúng ở đâu?

Tôi cũng trở thành người truyền bá trong công ty. Công cụ AI sẽ không thay thế ai — nhưng những người biết sử dụng công cụ AI hiệu quả sẽ vượt qua những người không biết.

2026: Vibe Coding Trang Web Này

Và bây giờ? Tôi đang viết bài này trên trang web tôi xây dựng hoàn toàn bằng "vibe coding" — coding cộng tác với trợ lý AI. Sự trớ trêu không thoát khỏi tôi.

Một thập kỷ trước, tôi đọc sách giáo khoa về nhân tử Lagrange để hiểu toán học đằng sau SVMs. Bây giờ tôi đang trò chuyện với hệ thống AI hiểu ngữ cảnh, sinh code, và giúp tôi suy nghĩ qua các vấn đề.

Lĩnh vực đã tiến hóa từ "AI không hoạt động" đến "AI có thể quá mạnh." Từ features thủ công đến representations học được. Từ mô hình task-specific hẹp đến hệ thống đa năng.

Những Gì Tôi Học Được

Một vài nguyên tắc nổi lên từ hành trình này:

1. Đầu tư vào nền tảng. Thời gian tôi dành cho nhân tử Lagrange không lãng phí. Hiểu nền tảng giúp bạn thích nghi qua các chuyển đổi mô hình.

2. Hoài nghi lành mạnh, cược không lành mạnh. Hoài nghi bất kỳ tuyên bố cụ thể nào. Nhưng đừng bao giờ cược chống lại tiến bộ tích lũy trong lĩnh vực có feedback loops mạnh.

3. Sợi chỉ quan trọng. Công việc tôi trải dài bảo mật mạng, DeFi, và AI. Sợi chỉ chung — hệ thống phi tập trung, tin tưởng qua xác minh — kết nối chúng lại. Tìm sợi chỉ của bạn.

4. Mỗi đỉnh cao là cao nguyên. Mỗi khoảnh khắc đều cảm thấy như đã đạt đỉnh cao năng lực AI. Mỗi khoảnh khắc chỉ là khởi đầu giai đoạn tiếp theo.

5. Xây dựng để hiểu. Đọc papers không đủ. Bạn phải xây dựng. Hành động sáng tạo tiết lộ những gì lý thuyết che giấu.


Tôi không biết thập kỷ tiếp theo mang lại gì. Nếu quá khứ là chỉ dẫn, nó sẽ làm mọi thứ trước đó trông cổ xưa. Phiên bản 2014 của tôi đọc sách giáo khoa Lagrange sẽ sững sờ với những gì có thể ngày nay. Phiên bản 2026 của tôi có lẽ sẽ nhìn lại bài viết này theo cách tương tự.

Mỗi thời kỳ đều cảm thấy là đỉnh cao. Mỗi thời kỳ chỉ là khởi đầu.