ChatGPT là một trong những công cụ AI mới và sáng giá nhất, nhưng các thuật toán hoạt động nền tảng thực sự đã tạo nên sức mạnh cho toàn bộ các ứng dụng và dịch vụ từ năm 2020. Vì vậy, để hiểu cách thức hoạt động của ChatGPT, chúng ta cần bắt đầu bằng cách nói về động cơ ngôn ngữ mang lại sức mạnh cho nó.
GPT trong ChatGPT chủ yếu là GPT-3 hoặc Generative Pre-trained Transformer 3, mặc dù GPT-4 hiện đã có sẵn cho các người dùng (thuê bao) của ChatGPT Plus và có thể sẽ sớm trở nên phổ biến hơn. Các mô hình GPT được phát triển bởi OpenAI (công ty đứng sau ChatGPT và trình tạo hình ảnh DALL·E 2), nhưng chúng là nền tảng sức mạnh cho mọi thứ, từ các tính năng AI gần đây của Bing đến các công cụ viết như Jasper và Copy.ai. Trên thực tế, hầu hết AI dựa trên văn bản hiện tại sử dụng GPT-3 và trong tương lai có thể sẽ dùng GPT-4 như một bước tiếp theo.
Mặc dù GPT-3 và GPT-4 là những mô hình ngôn ngữ lớn phổ biến nhất (LLM) ở thời điểm này, trong vài năm tới, có khả năng sẽ có nhiều sự cạnh tranh hơn. Ví dụ, Google chỉ tiết lộ Bard, AI Chatbot, được tạo bởi động cơ ngôn ngữ của riêng nó được gọi là mô hình ngôn ngữ cho các ứng dụng đối thoại (LAMDA). Nhưng hiện tại, GPT của OpenAI là tiêu chuẩn ngành theo thực tế. Nó là công cụ dễ nhất để mọi người có được
Vì vậy, câu trả lời cho "ChatGPT hoạt động như thế nào?" về cơ bản là GPT-3 và GPT-4. Nhưng hãy đào sâu hơn một chút
ChatGPT là gì?
ChatGPT là một ứng dụng được xây dựng bởi OpenAI. Sử dụng các mô hình ngôn ngữ GPT, nó có thể trả lời câu hỏi của bạn, tạo bản sao, nháp email, trò chuyện, giải thích các đoạn code trong các ngôn ngữ lập trình khác nhau, dịch ngôn ngữ tự nhiên sang code và nhiều hơn thế nữa - hoặc ít nhất là cố gắng - tất cả dựa trên các tin nhắn bằng tự nhiên mà bạn cung cấp cho nó. Nó là một chatbot, nhưng là một chatbot rất, rất tốt.
Mặc dù việc sử dụng nó khá là thú vị, ví dụ như bạn muốn viết một bài thơ về thú cưng của mình hoặc lấy một vài ý tưởng cho các dòng chủ đề trong email marketing, nó hoàn toàn có thể làm được. Đó cũng là một cách để chatGPT thu thập nhiều dữ liệu từ người dùng thực tế và thực hiện một buổi demo tuyệt vời để chứng minh sức mạnh của GPT, điều này có thể làm bạn cảm thấy hơi mơ hồ nếu bạn không chuyên sâu vào học máy (Machine Learning).
Hiện tại, ChatGPT cung cấp hai mô hình GPT. Mặc định là GPT-3.5, không quá mạnh mẽ nhưng lại miễn phí cho tất cả mọi người. GPT-4 tiên tiến hơn nhưng chỉ được áp dụng cho các người dùng ChatGPT Plus, mặc dù họ chỉ được hỏi một số lượng giới hạn câu hỏi mỗi ngày.
Một trong những tính năng quan trọng của ChatGPT là nó có thể ghi nhớ cuộc trò chuyện của bạn. Điều này có nghĩa là nó có thể lấy thông tin từ những gì bạn đã hỏi trước đó và sử dụng nó để cung cấp thông tin cho các cuộc trò chuyện tiếp theo. Bạn cũng có thể yêu cầu sửa đổi và chỉnh sửa, và nó sẽ tham khảo lại những gì bạn đã thảo luận trước đó. Điều này khiến việc tương tác với trí tuệ nhân tạo trở nên gần gủi một cuộc trò chuyện thực sự.
Nếu bạn muốn thực sự hiểu được nó, hãy dành năm phút để chơi với ChatGPT, sau đó quay lại đây và đọc về cách nó hoạt động.
ChatGPT hoạt động như thế nào?
ChatGPT hoạt động bằng cách cố gắng hiểu yêu cầu của bạn và sau đó đưa ra các chuỗi từ mà nó cho rằng sẽ trả lời câu hỏi của bạn một cách tốt nhất, dựa trên dữ liệu mà nó đã được đào tạo.
Nói về quá trình đào tạo, đó là một quá trình mà trí tuệ nhân tạo mới được đưa và triển khai sẽ được học một số quy tắc cơ bản, sau đó nó được đưa vào các tình huống hoặc được cung cấp rất nhiều dữ liệu để xử lý nhằm mục đích tự phát triển các thuật toán của riêng nó.
GPT-3 đã được huấn luyện trên khoảng 500 tỷ "token", thứ đã giúp cho mô hình ngôn ngữ có thể dễ dàng nhận diện nghĩa và dự đoán các từ ngữ tiếp theo có thể xuất hiện. Nhiều từ được ánh xạ thành một token, tuy nhiên đối với các từ dài hoặc phức tạp hơn, chúng thường bị phân tách thành nhiều token. Trung bình, các token có độ dài khoảng bốn ký tự. OpenAI đã giữ im lặng về cách thức hoạt động bên trong của GPT-4, nhưng chúng t hoàn toàn có thể đoán rằng nó đã được huấn luyện trên tập dữ liệu khổng lồ.
Tất cả các token đều xuất phát từ một tập dữ liệu khổng lồ được viết bởi con người. Bao gồm sách, báo và các tài liệu khác từ tất cả các chủ đề, hình thức và thể loại khác nhau - cùng với một lượng nội dung không thể đong đếm được, được thu thập từ Internet. Nói một cách đơn giản, điều này cho phép chatGPT tiếp cận với toàn bộ kiến thức của con người.
Tập dữ liệu khổng lồ này đã được sử dụng để tạo ra một mạng nơ-ron học sâu (Deep learning neural network) - một thuật toán phức tạp, nhiều lớp, có trọng số được mô hình hóa theo não bộ con người - cho phép ChatGPT học các mẫu và các mối quan hệ dữ liệu trong câu, khai thác khả năng tạo ra phản hồi giống con người bằng cách dự đoán các câu chữ tiếp theo trong bất kỳ đoạn văn nào.
Tuy nhiên, ChatGPT không hoạt động ở cấp độ câu, thay vào đó, nó tạo ra văn bản về những từ, câu và thậm chí cả đoạn văn hoặc khổ thơ. Nó không giống tính năng dự đoán từ kế tiếp trên điện thoại của bạn; Nó đang cố gắng tạo ra các phản hồi hoàn toàn mạch lạc cho bất kỳ yêu cầu nào.
Để tiếp tục tinh chỉnh khả năng phản hồi của Chatgpt và đáp ứng với nhiều yêu cầu khác nhau, nó đã được tối ưu hóa cho đối thoại với một kỹ thuật gọi là học tập tăng cường với phản hồi từ con người (RLHF). Về cơ bản, con người đã tạo ra một mô hình với dữ liệu so sánh (trong đó hai hoặc nhiều phản hồi mô hình được đánh giá bởi các huấn luyện viên AI), vì vậy AI có thể học được là phản hồi tốt nhất.