Tuần đầu tháng 7/2026 chứng kiến một cơn bão AI với 4 tin tức lớn: xAI đưa Grok 4.5 (1.5T tham số) vào private beta tại SpaceX & Tesla sau thương vụ thâu tóm Cursor trị giá 60 tỷ USD; Meituan gây sốc khi mở nguồn LongCat-2.0 với 1.6T tham số — huấn luyện hoàn toàn trên chip nội địa Trung Quốc; ByteDance Seedance 2.5 phá vỡ giới hạn video AI với 30 giây native 4K; và Z.ai ra mắt ZCode — desktop coding agent harness miễn phí cho GLM-5.2. Cùng Vivi điểm qua chi tiết!
Không khí AI đầu tháng 7 đang nóng đến nghẹt thở. Từ Mỹ sang Trung Quốc, từ model foundation đến video generation — mỗi mảng đều có những bước nhảy vọt ấn tượng. Hãy cùng phân tích từng tin tức một.
🚀 1. Grok 4.5 — Private Beta Tại SpaceX & Tesla Với 1.5T Tham Số V9
Elon Musk xác nhận Grok 4.5, model mới nhất của xAI với 1.5 nghìn tỷ tham số trên kiến trúc V9, đã vào private beta tại SpaceX và Tesla. Điểm đặc biệt: dữ liệu từ Cursor (AI coding assistant mà SpaceX vừa mua lại với giá 60 tỷ USD) được dùng trong supplemental training giúp Grok 4.5 mạnh về coding và reasoning kỹ thuật.
Elon Musk thông báo trên X vào ngày 28/06 rằng Grok 4.5 đã chạy nội bộ tại SpaceX và Tesla. Model được xây dựng trên V9 foundation với 1.5 nghìn tỷ tham số — gấp khoảng 3 lần V8-small từng chạy Grok 4. Điểm nhấn chiến lược: SpaceX mua lại Anysphere (công ty mẹ của Cursor) với giá 60 tỷ USD, và đội ngũ kỹ thuật của Cursor đã chuyển thẳng vào xAI để tái xây dựng khả năng coding của Grok từ gốc.
Theo Musk, early evaluations nội bộ cho thấy hiệu năng của Grok 4.5 “ngang hoặc vượt Claude Opus”, nhưng các con số này chưa được kiểm chứng độc lập. Điều thú vị hơn: Musk hứa hẹn phát hành model mới “huấn luyện từ đầu” hàng tháng cho đến hết 2026.

Grok 4.5, model mới nhất của xAI với 1.5 nghìn tỷ tham số, đã vào private beta tại SpaceX và Tesla với dữ liệu từ Cursor được tích hợp trong supplemental training. Nguồn: Crypto Briefing
🐱 2. Meituan LongCat-2.0 — 1.6T Tham Số MoE Trên Chip Nội Địa Trung Quốc
Meituan — gã khổng lồ giao đồ ăn Trung Quốc — vừa mở nguồn (MIT) LongCat-2.0, model 1.6 nghìn tỷ tham số với kiến trúc Mixture-of-Experts. Điểm gây sốc: toàn bộ quá trình training và inference đều chạy trên 50.000 card ASIC nội địa, không hề dùng NVIDIA GPU.
LongCat-2.0 không chỉ ấn tượng về quy mô (1.6T total, ~48B activated per token), mà còn về context window: 1 triệu token nhờ cơ chế LongCat Sparse Attention (LSA). Kiến trúc MOPD (Multi-Teacher On-Policy Distill) hợp nhất ba nhóm expert: Agent (tool use), Reasoning (STEM), và Interaction (alignment). Kết quả: SWE-bench Pro đạt 59.5 (dẫn trước GPT-5.5 và Claude Opus 4.6), Terminal-Bench 2.1 đạt 70.8.
Trước khi phát hành chính thức, LongCat-2.0 preview đã đứng top 3 OpenRouter toàn cầu về call volume — một thành tựu đáng kinh ngạc cho một model Trung Quốc. Model weights chưa public ngay nhưng đã ghi “coming soon” trên HuggingFace. Meituan đang chứng minh rằng không cần NVIDIA GPU vẫn có thể train model trillion-parameter.

Kiến trúc MOPD của LongCat-2.0 kết hợp ba nhóm chuyên gia: Agent (công cụ), Reasoning (suy luận), và Interaction (tương tác) — model đạt 59.5 SWE-bench Pro, dẫn trước cả GPT-5.5 và Claude Opus. Nguồn: Meituan Tech Blog
🎬 3. ByteDance Seedance 2.5 — 30 Giây Native 4K AI Video Trong Một Lần
ByteDance công bố Seedance 2.5 tại hội nghị Volcano Engine FORCE 2026: model video generation thế hệ mới tạo clip 30 giây native 4K chỉ trong một lần — không cần ghép nối, không upscale. Hỗ trợ đến 50 reference inputs đa phương thức (ảnh, video, audio, 3D).
Nếu Seedance 2.0 đã dẫn đầu Artificial Analysis Video Arena với Elo 1.219 (vượt Google Veo 3.1 và Kling 3.0), thì Seedance 2.5 hứa hẹn một bước nhảy vọt thực sự. Khả năng native 30 giây single-shot phá vỡ trần ~5-15 giây của hầu hết model hiện tại, mở ra ứng dụng cho quảng cáo TikTok, Reels, thương mại điện tử và sản xuất nội dung chuyên nghiệp.
Các tính năng chính: 50 multimodal references (gấp ~4 lần 2.0), localized re-draw editing (sửa một phần mà không động đến phần còn lại), native 4K với 10-bit color, âm thanh đồng bộ trong cùng latent space. Enterprise beta đã mở, public launch dự kiến đầu tháng 7. Giá chưa công bố nhưng Seedance 2.0 đã rất cạnh tranh ($9/phút ở 1080p).

Seedance 2.5 của ByteDance tạo clip 30 giây 4K chỉ trong một lần, hỗ trợ đến 50 reference inputs và localized re-draw editing — bước đột phá cho AI video generation trong sản xuất chuyên nghiệp. Nguồn: SeedDance
💻 4. ZCode — Desktop Coding Agent Harness Miễn Phí Cho GLM-5.2
Z.ai (Zhipu AI) ra mắt ZCode, desktop coding agent harness miễn phí dành riêng cho GLM-5.2. Hỗ trợ Goals (đa bước), multi-agent collaboration, MCP, và bot control qua WeChat/Feishu/Telegram. Giá từ $16.2/tháng (Lite) đến $144/tháng (Max).
ZCode không phải một model — nó là môi trường agentic IDE chạy GLM-5.2 bên dưới. Tính năng nổi bật: Goals (quản lý tác vụ dài hạn với planning, execution, verification), Multi-Agent (frontend/backend/QA agents chuyên biệt), và Bot Control (điều khiển từ xa qua WeChat, Feishu, Telegram). GLM-5.2 tự nó đã là open-source model mạnh nhất trong làng coding agent — với SWE-bench Pro 62.1 và Terminal-Bench 2.1 đạt 81.0, chỉ sau Claude Opus 4.8 vài điểm.
ZCode tương thích VS Code và JetBrains, hỗ trợ 20+ programming tools (Git, terminal), có MCP support. Pricing từ Lite ($16.2/tháng) cho lightweight iteration đến Max ($144/tháng) cho high-volume workloads. Được ví như “Claude Code của Trung Quốc” — nhưng ZCode miễn phí tải về, chỉ trả tiền cho GLM Coding Plan.

GLM-5.2 là open-source coding model mạnh nhất hiện tại với Terminal-Bench 2.1 đạt 81.0 và SWE-bench Pro 62.1 — ZCode là desktop harness chạy model này, miễn phí tải về. Nguồn: Z.ai Docs
📊 Tổng Kết
Tuần đầu tháng 7/2026 cho thấy bức tranh AI đa chiều hơn bao giờ hết:
| Sự kiện | Công ty | Điểm nhấn | Trạng thái |
|---|---|---|---|
| Grok 4.5 | xAI | 1.5T params V9 + Cursor data, ngang Opus? | Private beta SpaceX/Tesla |
| LongCat-2.0 | Meituan | 1.6T MoE, chip nội địa, MIT license | Open source (weights sắp ra) |
| Seedance 2.5 | ByteDance | 30s native 4K, 50 references | Enterprise beta |
| ZCode + GLM-5.2 | Z.ai | Desktop agent harness, multi-agent | Miễn phí, GLM-5.2 MIT |
Cuộc đua AI đang chuyển từ “ai có model lớn hơn” sang “ai deploy được vào thực tế nhanh hơn”. Grok 4.5 chạy trong dây chuyền sản xuất Tesla, LongCat-2.0 mở nguồn cho cả thế giới, Seedance 2.5 sẵn sàng cho sản xuất video chuyên nghiệp, và ZCode đưa coding agent vào desktop của mọi lập trình viên. Đây là tốc độ chưa từng thấy.
Theo dõi Zeo Da Vu để không bỏ lỡ những phân tích công nghệ chi tiết nhất! 🚀