Những công nghệ AI biến văn bản thành video độc đáo

Những AI biến văn bản thành video tương tự Sora
Khám phá những công nghệ AI độc đáo có khả năng biến văn bản thành video chất lượng cao, từ Sora của OpenAI đến Lumiere của Google và VideoPoet của G0ogle.

Những công nghệ AI đang ngày càng phát triển và mang lại những ứng dụng độc đáo.

Những công nghệ AI đang ngày càng phát triển và mang lại những ứng dụng độc đáo. Trong lĩnh vực biến văn bản thành video, có nhiều mô hình AI đáng chú ý như Sora của OpenAI, Lumiere của Google, VideoPoet của G0ogle và Emu Video của Meta. Cùng khám phá những công nghệ này và những ứng dụng thú vị của chúng.

Sora - Sản phẩm đỉnh cao của OpenAI

Sora là một trong những công nghệ AI mới nhất và gây xôn xao trong cộng đồng. Được phát triển bởi OpenAI - nhà phát triển nổi tiếng của ChatGPT, Sora đã chinh phục được nhiều người bởi chất lượng video tuyệt vời mà nó tạo ra chỉ từ một lệnh văn bản. Sự thành công của ChatGPT đã giúp cho trí tuệ nhân tạo của OpenAI có khả năng hiểu ngôn ngữ sâu sắc. Sora đã thể hiện khả năng tạo ra những video sinh động, với nhân vật chuyển động và sắc thái tự nhiên.

Tuy nhiên, hiện tại Sora vẫn chưa được phát hành công khai vì những lý do an toàn. OpenAI đang tiến hành các biện pháp đo lường cẩn trọng trước khi đưa sản phẩm này đến tay người dùng đại chúng. Điều này càng cần thiết trong bối cảnh trí tuệ nhân tạo đang bị lợi dụng cho các mục đích xấu, như giả mạo người dùng hoặc sử dụng phi pháp.

Lumiere - Sự sáng tạo của Google

Lumiere là một sản phẩm đến từ Google, cũng có khả năng biến văn bản thành video. Điểm đặc biệt của Lumiere là nó không chỉ đơn thuần ghép các khung hình tĩnh lại với nhau, mà thay vào đó, nó xác định chi tiết trong video và theo dõi cách chúng chuyển động và thay đổi theo thời gian. Điều này giúp quá trình tạo video trở nên trôi chảy và tự nhiên hơn.

Tương tự như Sora, Lumiere cũng chưa được phát hành công khai. Google đã giới thiệu mô hình này vào cuối tháng 1 năm 2024 sau khi ra mắt Gemini - một mô hình ngôn ngữ lớn được đồng bộ với Bard.

VideoPoet - Sự sáng tạo của G0ogle

VideoPoet là một mô hình ngôn ngữ lớn (LLM) được phát triển bởi Google Search. Mô hình này được đào tạo từ kho video, ảnh, âm thanh và văn bản khổng lồ. VideoPoet có khả năng thực hiện nhiều nhiệm vụ khác nhau, từ tạo video từ văn bản, làm nổi bật nội dung, chuyển video thành âm thanh, đến biến ảnh tĩnh thành ảnh động.

Ý tưởng ban đầu của VideoPoet bắt nguồn từ việc chuyển mọi mô hình ngôn ngữ tự hồi quy sang một hệ thống tạo video. Các mô hình ngôn ngữ tự hồi quy hiện tại có thể xử lý văn bản và mã lập trình như con người, nhưng gặp rào cản khi chuyển sang video. VideoPoet giải quyết vấn đề này bằng cách sử dụng mã thông báo để chuyển đổi dữ liệu nhập vào từ bất kỳ định dạng nào thành ngôn ngữ mà nó có thể hiểu.

Emu Video - Sáng tạo của Meta

Emu Video là một công nghệ AI khác có khả năng chuyển hình ảnh thành văn bản và sử dụng nó để tạo ra video. Được phát triển bởi Meta, công ty sở hữu Facebook, Emu Video đã nhận được nhiều đánh giá tích cực từ người tham gia chương trình thử nghiệm. Trên 81% người dùng thích Emu Video hơn Imagen Video của Google và hơn 90% lựa chọn mô hình của Meta thay vì PYOCO của Nvidia. Emu Video được đánh giá là tốt hơn cả Make-A-Video, một sản phẩm khác của Meta.

CogVideo - Sáng tạo từ Đại học Thanh Hoa, Trung Quốc

CogVideo là một công nghệ AI đặc biệt, được phát triển bởi một nhóm nghiên cứu đến từ Đại học Thanh Hoa - một trường đại học danh tiếng hàng đầu tại Trung Quốc và châu Á. CogVideo dựa trên mô hình CogView2, một mô hình đã được huấn luyện trước để chuyển văn bản thành hình ảnh.

CogVideo đã nhận được sự công nhận từ các chuyên gia sáng tạo nghệ thuật trên máy tính. Glenn Marshall, một nghệ sĩ máy tính nổi tiếng, đã thử nghiệm CogVideo và cho rằng "giới đạo diễn có thể mất việc". Một trong những clip do ông tạo ra với sự trợ giúp của CogVideo đã nhận được nhiều đánh giá cao và từng được đề cử giải thưởng điện ảnh BAFTA.

Những công nghệ AI biến văn bản thành video đang mang lại những khả năng sáng tạo mới và tiềm năng lớn.

Dù vẫn còn đang trong giai đoạn thử nghiệm và phát triển, nhưng chúng hứa hẹn sẽ mang đến những trải nghiệm độc đáo và thú vị cho người dùng trong tương lai.

Nguồn: Báo Thanh Niên

[question] Các công ty nào đang phát triển AI biến văn bản thành video?,Sora là sản phẩm của công ty nào?
2 Lượt thích