Người yêu tao là ai

Qua bài viết này Askanswerswiki xin chia sẻ với các bạn thông tin và kiến thức về Người yêu tao là ai hot nhất hiện nay được bình chọn bởi người dùng

Nhận thức theo thời gian thực về các hoạt động có thể là một bước tiến lớn trong việc giúp AI nhận thức được thế giới bên ngoài.

Hiện tại, nếu một máy tính có khả năng nhận diện một con mèo hoặc một con vịt trong một hình ảnh tĩnh, thì máy tính đó đã khá thông minh. Tuy nhiên, trong tương lai, AI sẽ phải có khả năng nhận ra các hành động của mèo, chẳng hạn như đuổi vịt quanh bếp.

MIT và IBM đã tạo ra một tập dữ liệu khổng lồ bao gồm các đoạn video được chú thích chi tiết về các hành động được thực hiện trong chúng. Dữ liệu trong tập dữ liệu thời gian bao gồm đoạn phim dài ba giây về các hoạt động khác nhau, chẳng hạn như câu cá hoặc sống tự do.

Chỉ trong 3 thước phim trên giấy, AI liên tục đưa ra dự đoán về các hành động: tập thể dục - giữ thăng bằng - kéo căng cơ thể.

Chỉ trong 3 thước phim trên giấy, AI liên tục đưa ra dự đoán về các hành động: tập thể dục – giữ thăng bằng – kéo căng cơ thể.

Aude Oliva, một nhà khoa học nghiên cứu tại MIT và là một trong những người đứng sau dự án, cho biết:Rất nhiều thứ trên thế giới thay đổi mỗi giây. Nếu bạn muốn hiểu tại sao điều gì đó đang xảy ra, chuyển động cung cấp cho bạn nhiều thông tin mà bạn không thể nắm bắt trong một khung hình. “

Sự bùng nổ trong công nghệ trí tuệ nhân tạo được châm ngòi bởi sự thành công của việc dạy máy tính nhận dạng nội dung của ảnh tĩnh bằng cách đào tạo các mạng nơ-ron sâu trong các tập dữ liệu được gắn nhãn lớn.

Các hệ thống AI hiện tại có khả năng phân tích video, bao gồm cả những hệ thống trong ô tô tự lái, thường dựa vào việc đóng khung các đối tượng trong khung hình tĩnh hơn là phân tích các hành động. Gần đây, Google đã tung ra một công cụ có khả năng nhận dạng các đối tượng trong video, một trong những tính năng của Cloud Platform, một dịch vụ đã bao gồm các công cụ AI để xử lý hình ảnh, âm thanh và văn bản.

Thử thách tiếp theo sẽ là ngoài việc dạy cho máy móc hiểu nội dung video, chúng tôi còn phải dạy chúng điều gì đang xảy ra trong những thước phim đó. Ứng dụng này có thể mang lại nhiều lợi ích thiết thực, chẳng hạn như tạo ra những cách mới để tìm kiếm, chú thích và khai thác video. Ứng dụng này cũng sẽ giúp robot hoặc ô tô tự lái hiểu rõ hơn về thế giới xung quanh.

Dự án MIT-IBM trên thực tế chỉ là một trong nhiều bộ dữ liệu video được thiết kế để nâng cao tiến độ trong việc đào tạo máy móc để hiểu các hành động ở thế giới bên ngoài. Ví dụ, năm ngoái, Google đã phát hành một bộ 8 triệu video YouTube có tên YouTube-8M. Facebook cũng đang phát triển một tập dữ liệu bao gồm cảnh quay, được chia thành Cảnh, Hành động và Tạo tác.

Olga Russakovsky, một trợ lý giáo sư tại Đại học Princeton chuyên về viễn thám máy tính, cho biết họ đang gặp khó khăn trong việc phát triển các bộ dữ liệu video hữu ích vì chúng đòi hỏi nhiều không gian lưu trữ và tính toán hơn. so với ảnh tĩnh. “Tôi rất vui được thử nghiệm với những dữ liệu mới này” cô ấy nói. “Tôi nghĩ video 3 giây là tuyệt vời – nó cung cấp ngữ cảnh tạm thời và đồng thời giữ cho yêu cầu lưu trữ và tính toán ở mức thấp.”

Các nhà khoa học khác cũng đang áp dụng các cách tiếp cận sáng tạo để giải quyết vấn đề. Twenty Billion Neurons, một công ty khởi nghiệp ở Toronto và Berlin, đã tạo ra một tập dữ liệu tùy chỉnh bằng cách trả tiền cho nhân viên để thực hiện các nhiệm vụ đơn giản. Một trong những người sáng lập công ty, Roland Memisevic, nói rằng công ty cũng sử dụng mạng nơ-ron được thiết kế đặc biệt để xử lý thông tin thị giác theo thời gian.

Anh ấy nói: “Các mạng được đào tạo với các bộ dữ liệu khác có thể cho bạn biết liệu một video đang chiếu một trận bóng đá hay một bữa tiệc. Các mạng của chúng tôi có thể cho bạn biết liệu có ai đó vừa vào phòng hay không.”

Danny Gutfreund, một nhà nghiên cứu tại IBM, người đã hợp tác trong dự án, cho biết rằng việc nhận ra các hành động hiệu quả sẽ yêu cầu máy tính học về một con người thực hiện một hành động và sau đó chuyển giao nó. kiến thức này vào một trường hợp khác, nơi một con vật cũng đang thực hiện hành động tương tự. Những tiến bộ trong lĩnh vực này, được gọi là học tập chuyển tiếp, sẽ trở nên quan trọng đối với tương lai của AI. “Hãy xem cách máy móc có thể thực hiện quá trình học tập chuyển tiếp mà con người chúng ta có thể làm rất tốt” anh ấy nói.

Gutfreund cho biết thêm rằng công nghệ này cũng có các ứng dụng thực tế. “Bạn có thể sử dụng nó để chăm sóc người già, để có thể biết khi nào ai đó bị ngã, hoặc đã có người uống thuốc hay chưa”. anh ấy nói. “Bạn có thể tưởng tượng các thiết bị có thể hỗ trợ người mù.”

Tham khảo Đánh giá công nghệ

Nghe nhiều về AI nhưng bạn đã thực sự hiểu về nó chưa? Nếu chưa thì đây là bài viết bạn nên đọc

Vừa rồi, bạn vừa mới đọc xong bài viết về Hiểu được ảnh là “chuyện nhỏ”, bước tiếp theo của AI là hiểu được video

tại Tips Tech. Hy vọng rằng những kiến thức trong bài viết Hiểu được ảnh là “chuyện nhỏ”, bước tiếp theo của AI là hiểu được video

sẽ làm cho bạn để tâm hơn tới vấn đề Hiểu được ảnh là “chuyện nhỏ”, bước tiếp theo của AI là hiểu được video

hiện nay. Hãy cũng với Tip Techs khám phá thêm nhiều bài viết về Hiểu được ảnh là “chuyện nhỏ”, bước tiếp theo của AI là hiểu được video

nhé.

Bài viết Hiểu được ảnh là “chuyện nhỏ”, bước tiếp theo của AI là hiểu được video

đăng bởi vào ngày 2022-09-22 07:58:50. Cảm ơn bạn đã bỏ thời gian đọc bài tại Tips Tech

Nguồn: genk.vn

Related Posts