MiroFish: tham vọng xây dựng “cỗ máy dự đoán vạn vật” bằng mô phỏng đa tác tử

Trong làn sóng bùng nổ của AI tạo sinh, nhiều dự án đang cố gắng đi xa hơn chatbot và trợ lý nội dung để chạm tới một mục tiêu khó hơn nhiều: mô phỏng thế giới và dự đoán tương lai. MiroFish là một dự án mã nguồn mở đang thu hút sự chú ý theo hướng đó. Trên GitHub, dự án tự giới thiệu là “A Simple and Universal Swarm Intelligence Engine, Predicting Anything” — một động cơ trí tuệ bầy đàn đơn giản, phổ quát, hướng tới việc “dự đoán vạn vật”. Repository này hiện công khai, dùng giấy phép AGPL-3.0, có hơn 33.000 sao và hơn 4.000 lượt fork tại thời điểm truy cập.

MiroFish: tham vọng xây dựng “cỗ máy dự đoán vạn vật” bằng mô phỏng đa tác tử

Theo phần mô tả chính thức, MiroFish là một AI prediction engine dựa trên công nghệ multi-agent. Ý tưởng cốt lõi là lấy “seed information” từ thế giới thực — chẳng hạn tin nóng, dự thảo chính sách hay tín hiệu tài chính — rồi dựng nên một thế giới số song song có độ trung thực cao. Trong không gian đó, hàng nghìn tác tử AI với cá tính riêng, trí nhớ dài hạn và logic hành vi riêng sẽ tương tác, hình thành tiến hóa xã hội, từ đó tạo ra báo cáo dự đoán hoặc môi trường mô phỏng có thể tương tác sâu.

Điểm đáng chú ý của MiroFish là cách dự án định vị mình không chỉ như một công cụ phân tích dữ liệu, mà như một “digital sandbox” cho cả cấp độ vĩ mô lẫn vi mô. Ở cấp độ vĩ mô, nhóm phát triển nói đến các kịch bản thử nghiệm cho nhà hoạch định chính sách hoặc xử lý truyền thông, nơi quyết định có thể được “diễn tập” trong môi trường ít rủi ro hơn. Ở cấp độ vi mô, dự án mở rộng sang những bài toán giàu tính sáng tạo hơn, như giả lập diễn biến của các câu chuyện, tiểu thuyết hoặc tình huống giả định. Nói cách khác, MiroFish đang đặt mình ở giao điểm giữa AI simulation, social prediction, narrative inference và decision support.

Về quy trình vận hành, README của dự án mô tả một pipeline khá rõ. Bước đầu là graph building, gồm trích xuất dữ liệu hạt giống, bơm ký ức cho cá nhân và tập thể, rồi xây dựng GraphRAG. Tiếp theo là environment setup, nơi hệ thống trích xuất quan hệ thực thể, tạo persona và cấu hình tác tử. Sau đó đến giai đoạn simulation, khi các nền tảng mô phỏng chạy song song, tự phân tích yêu cầu dự đoán và cập nhật ký ức theo trục thời gian. Cuối cùng, một ReportAgent sẽ tạo báo cáo và người dùng có thể tương tác trực tiếp với các tác tử trong thế giới mô phỏng.

Nếu nhìn từ góc độ kỹ thuật, đây là một dự án khá gần với xu hướng mà giới AI đang quan tâm: agent-based simulation kết hợp knowledge graph và long-term memory. Repo gắn các chủ đề như knowledge-graph, swarm-intelligence, multi-agent-simulation, social-prediction, future-prediction, financial-forecasting, public-opinion-analysis, llms, và agent-memory. Điều đó cho thấy MiroFish không chỉ muốn dừng ở chatbot đa tác tử, mà muốn trở thành một hạ tầng mô phỏng hành vi tập thể, có khả năng suy diễn các kịch bản xã hội, tài chính hoặc dư luận.

Một chi tiết khác làm dự án dễ tiếp cận hơn là MiroFish đã chuẩn bị sẵn demo online, ảnh chụp giao diện và video minh họa. Các ví dụ được giới thiệu gồm một bài toán mô phỏng dư luận liên quan đến Đại học Vũ Hán và một tình huống thú vị hơn về việc dự đoán kết thúc thất truyền của “Hồng Lâu Mộng” dựa trên 80 hồi đầu. Sự kết hợp giữa use case nghiêm túc và use case mang tính sáng tạo cho thấy đội ngũ phát triển đang muốn chứng minh tính linh hoạt của engine, từ phân tích xã hội đến suy diễn văn học.

Xét về triển khai, dự án hỗ trợ cả source deployment lẫn Docker deployment. README nêu yêu cầu Node.js 18+, Python từ 3.11 đến 3.12, cùng công cụ uv để quản lý gói Python. Người dùng cần cấu hình khóa API cho mô hình ngôn ngữ theo chuẩn tương thích OpenAI SDK, với ví dụ được khuyến nghị là Qwen-plus qua nền tảng Alibaba Bailian, đồng thời cấu hình thêm Zep Cloud cho phần bộ nhớ. Việc hỗ trợ Docker cùng cấu trúc tách frontend và backend cho thấy dự án không chỉ là bản demo nghiên cứu mà đã được chuẩn bị để cộng đồng tự chạy thử tương đối thuận tiện.

Từ cấu trúc mã nguồn công khai, repo gồm các thư mục backend, frontend, static/image, cùng Dockerfile, docker-compose.yml và file cấu hình môi trường mẫu. GitHub cũng ghi nhận ngôn ngữ chính của dự án là PythonVue, tương ứng khoảng 57.8% và 41.1% tại thời điểm truy cập. Điều này gợi ý backend mô phỏng và orchestration chủ yếu viết bằng Python, còn giao diện tương tác được xây bằng Vue.

Một điểm nền tảng khác là MiroFish cho biết engine mô phỏng của mình được xây trên OASIS (Open Agent Social Interaction Simulations) và dự án nhận được sự hỗ trợ chiến lược, ươm tạo từ Shanda Group. Nếu thông tin này phản ánh đúng tình trạng thực tế của dự án, đây là dấu hiệu cho thấy MiroFish đang cố bước ra khỏi phạm vi một repo thử nghiệm cá nhân để trở thành một sản phẩm có định hướng rõ ràng hơn về nghiên cứu và ứng dụng. Đồng thời, repo cũng công bố email tuyển dụng và mời gọi cộng đồng quan tâm tới multi-agent simulation và LLM applications tham gia.

Dĩ nhiên, cũng cần nhìn MiroFish với sự tỉnh táo. Những tuyên bố như “predicting anything” hay “dự đoán vạn vật” mang tính tham vọng marketing rất cao. Dựa trên nội dung công khai, có thể thấy dự án đã trình bày một kiến trúc ý tưởng hấp dẫn, có demo, có quy trình, có tài liệu cài đặt và nhận được mức độ quan tâm lớn trên GitHub. Tuy vậy, hiệu quả dự đoán thực tế trong các bài toán nghiêm túc như tài chính, chính sách hay dư luận xã hội vẫn cần được kiểm chứng độc lập bằng benchmark, dữ liệu đối chiếu và đánh giá khoa học chặt chẽ hơn. Phần mô tả hiện tại phản ánh rõ tầm nhìn và kiến trúc của dự án, nhưng chưa tự động đồng nghĩa với năng lực dự báo đã được xác minh rộng rãi.

Dù còn cần thêm thời gian để kiểm chứng, MiroFish vẫn là một trong những dự án đáng chú ý ở giao điểm giữa AI agents, mô phỏng xã hội, GraphRAG và dự báo tương lai. Ít nhất ở thời điểm hiện tại, nó cho thấy một hướng đi rất đáng quan sát: thay vì chỉ để AI trả lời câu hỏi, hãy để AI dựng lên một thế giới số, cho các “cá thể” bên trong tự vận động, rồi từ đó quan sát điều gì có thể xảy ra tiếp theo. Nếu xu hướng multi-agent simulation tiếp tục phát triển mạnh, những dự án như MiroFish rất có thể sẽ trở thành một lớp sản phẩm mới, nằm giữa công cụ phân tích, phòng thí nghiệm xã hội số và nền tảng mô phỏng quyết định.