A.I. Sẵn Sàng Viết Lại Lịch Sử. Theo Nghĩa Đen

GIỚI THIỆU: TV&BH: CHUYÊN MỤC: ChatGPT DỊCH THUẬT

The NYT: A.I. Is Poised to Rewrite History. Literally.

Tác Giả: Bill Wasik

(Chuyển ngữ tiếng Việt: Gemini; Hiệu đính (và chịu trách nhiệm): T.Vấn)

A.I. Sẵn Sàng Viết Lại Lịch Sử. Theo Nghĩa Đen.

Bill Wasik (giám đốc biên tập)

Ngày 16 tháng 6 năm 2025

Trong 25 năm làm biên tập viên tạp chí, phần công việc yêu thích của tôi luôn là giúp các cây bút tìm ra câu chuyện: bắt đầu từ đâu, kết thúc ở đâu, điều gì quan trọng và mới mẻ về nó. Vì vậy, với không ít sự khiêm tốn, vào đầu năm nay, tôi đã ngồi trong một căng tin của Google dọc theo West Side của Manhattan và chứng kiến một trong những cây bút lâu năm của tôi – Steven Johnson, nhà báo và nhà sử học công nghệ – nhận được sự hướng dẫn kiểu đó từ một AI thay vì từ tôi.

Johnson, người đã xuất bản những cuốn lịch sử phổ biến về các cuộc tấn công của cướp biển, sự ra đời của lực lượng cảnh sát hiện đại và sự khai sinh của y tế công cộng, giải thích rằng ông đã bắt đầu suy nghĩ về một cuốn sách tiềm năng về cơn sốt vàng California giữa thế kỷ 19. Nhưng ông vẫn đang ở giai đoạn mà ông không biết nhiều hơn thế. “Điểm nhấn của tôi là gì?” ông nói. “Thực sự, tôi không biết.”

Để tìm ra, Johnson đã tải một số nguồn tài liệu của mình vào NotebookLM, một ứng dụng dành cho nhà nghiên cứu và nhà văn mà chính ông đã giúp xây dựng, sau khi trở thành giám đốc biên tập của bộ phận Google Labs ba năm trước. Không giống như hầu hết các công cụ AI khác, vốn đưa ra câu trả lời cho các câu hỏi từ vô số dữ liệu khổng lồ mà chúng được đào tạo, NotebookLM chỉ lấy thông tin từ các tệp do người dùng chọn, với tiền đề rằng hầu hết các hình thức nghiên cứu đều được hưởng lợi từ việc quản lý cẩn thận tài liệu nguồn của bạn.

Kể từ khi sản phẩm được phát hành trên toàn thế giới vào năm ngoái, Google và Johnson đã quảng bá tiện ích của nó cho đủ loại tác vụ, cho dù đó là tự động tạo biên bản và tóm tắt từ bản ghi âm cuộc họp hay khuyến khích việc sử dụng AI hợp pháp hơn giữa các sinh viên đại học. Khả năng “gây sốt” nhất của NotebookLM là một podcast tự động tạo, chỉ trong vài phút sẽ tạo ra một cuộc trò chuyện chi tiết giữa hai giọng nói cực kỳ chân thực, rút ra những khái niệm chính của tài liệu nguồn. Nhưng với tư cách là một tác giả thỉnh thoảng viết sách lịch sử, tôi quan tâm nhất đến cách AI – một trong nhiều siêu năng lực của nó là khả năng “nuốt” lượng lớn văn bản ngay lập tức và đưa ra các bản tóm tắt đáng tin cậy – có thể thay đổi cách viết lịch sử.

Tối hôm đó tại Google, khi mặt trời lặn trên sông Hudson, Johnson cho tôi xem kết quả các thử nghiệm của ông cho đến nay. Ông bắt đầu quá trình động não bằng cách cung cấp cho NotebookLM các trích đoạn từ một trong những cuốn lịch sử hiện có hay nhất về Cơn sốt vàng, cuốn “The Age of Gold” của H.W. Brands. Ông nghĩ rằng mình có thể muốn tập trung vào xung đột giữa những người tìm vàng da trắng và các nhóm người Mỹ bản địa sống ở Thung lũng Yosemite vào những năm 1850, vì vậy ông đã tải lên văn bản của một nguồn cũ hơn có tên “Discovery of the Yosemite,” của Lafayette Houghton Bunnell, người từng là thành viên của Tiểu đoàn Mariposa, đơn vị dân quân đã cưỡi ngựa vào thung lũng năm 1851. Tiếp theo, để đưa vào quan điểm của người bản địa, ông đã vào các trang web thuộc phạm vi công cộng và tìm thấy hai tài liệu về những người mà tiểu đoàn đã trục xuất khỏi thung lũng: “The Ahwahneechees: A Story of the Yosemite Indians” và “Indians of the Yosemite Valley and Vicinity.”

Johnson bắt đầu cuộc trò chuyện của mình với NotebookLM bằng một chút định hướng, tự nhận mình là tác giả Steven Johnson, để AI (với khả năng đào tạo cho phép nó hiểu gần như toàn bộ internet, giống như ChatGPT, ngay cả khi nó giới hạn câu trả lời trong các nguồn đã tải lên) có thể nắm bắt được loại sách ông viết. Sau đó, ông bắt đầu hỏi liên tục: Điều gì trong hai nguồn tập trung vào trải nghiệm của người bản địa, ông hỏi, bị thiếu trong hai nguồn khác? Khi mô hình trả về bản tóm tắt của nó, mắt ông bị thu hút bởi nhận xét rằng “The Ahwahneechees,” bằng cách bao gồm các tiểu sử ngắn của từng người dân Yosemite, “giúp nhân hóa những người này vượt ra ngoài một khối bộ lạc, điều mà ‘The Age of Gold’ và cuốn sách của Bunnell có xu hướng làm.” AI đã liệt kê một số tên của họ, trong số đó có Maria Lebrado, cháu gái của thủ lĩnh Yosemite Teneiya.

Điều đó đã khơi dậy sự quan tâm của Johnson. Ông yêu cầu thêm thông tin về Lebrado, và công cụ này đã trả về gần 600 từ tiểu sử – rằng bà là một trong 72 người bản địa bị Tiểu đoàn buộc phải rời thung lũng vào tháng 3 năm 1851; rằng cuối cùng bà kết hôn với một người đàn ông Mexico điều hành một đoàn vận chuyển ở Thung lũng Trung tâm; rằng bà được một nhà sử học da trắng “khám phá” vào những năm 1920 và được coi là người cuối cùng của những người Yosemite bản địa nguyên thủy.

Ngay lập tức, Johnson nhận ra rằng bà sẽ là một nhân vật tuyệt vời. Ông đặc biệt ghi nhận việc Lebrado trở lại thung lũng gần cuối đời. “Tôi nghĩ, cấu trúc [chết tiệt] của ‘Titanic’ là gì?” ông nói đùa. Cuốn sách có thể mở đầu bằng những gì Johnson hình dung là chuyến trở về thung lũng đầy cảm xúc của Lebrado khi bà gần 90 tuổi, trước khi quay ngược thời gian – về tuổi thơ của bà, về một dàn nhân vật rộng lớn hơn và bi kịch bạo lực của những năm 1850.

Johnson vẫn chưa bị thuyết phục hoàn toàn với ý tưởng này. Nhưng ông kinh ngạc về cách AI, hoạt động với hầu hết các văn bản mã nguồn mở và một lượng nhỏ công sức của con người, đã mang lại cho ông một ý tưởng mà ông hoàn toàn có thể sử dụng. “Mọi thứ tôi vừa cho bạn xem chỉ mất khoảng 30 phút làm việc,” ông nói.

Giống như hầu hết những người làm việc với ngôn từ để kiếm sống, tôi đã theo dõi sự trỗi dậy của các mô hình ngôn ngữ lớn với sự kết hợp giữa mê hoặc và kinh hoàng, và tôi thấy rùng mình khi tưởng tượng một trong số chúng viết thay tôi. Nhưng tôi phải thú nhận, có điều gì đó quyến rũ về ý tưởng để AI đọc thay tôi – xét đến cách sự bùng nổ của văn bản số hóa trong kỷ nguyên internet hiện nay đã chế nhạo các nhà văn phi hư cấu với quyền truy cập vào nhiều nguồn tài liệu đồ sộ hơn về bất kỳ chủ đề nào đó mà chúng ta không thể nào xử lý hết được. Điều này không chỉ đúng với các chủ đề hiện tại mà còn cả các chủ đề trong quá khứ: Bất kỳ người đam mê lịch sử nào cũng biết rằng vài giờ tìm kiếm trực tuyến, giữa hàng chục triệu cuốn sách được Google số hóa, kho tàng vô tận các bài báo học thuật có sẵn trên JSTOR, các cơ sở dữ liệu báo chí cho phép bạn tìm kiếm theo từ khóa hàng trăm ấn phẩm vào bất kỳ ngày nào trong lịch sử, có thể tạo ra tài liệu đọc đáng giá hàng tháng hoặc thậm chí hàng năm. Không thể đọc hết tất cả, nhưng một khi bạn biết nó tồn tại, bạn cảm thấy vô trách nhiệm nếu không đọc nó.

Điều gì sẽ xảy ra nếu bạn có thể giao phó phần lớn công việc đọc đó cho người khác… hoặc thứ khác? Khi AI ngày càng có khả năng phân tích các bộ dữ liệu lớn, dường như không thể tránh khỏi việc các nhà sử học và các nhà văn phi hư cấu khác sẽ tìm đến nó để được hỗ trợ; trên thực tế, như tôi đã khám phá khi khảo sát nhiều nhà sử học khác nhau trong vài tháng qua, các thử nghiệm với nó đã phổ biến hơn nhiều so với tôi mong đợi. Nhưng dường như cũng không thể tránh khỏi việc sức mạnh này để giúp tìm kiếm và tổng hợp các văn bản lịch sử sẽ thay đổi các loại sách lịch sử được viết. Nếu lịch sử, theo câu ngạn ngữ, được viết bởi những người chiến thắng, thì việc tự hỏi những người chiến thắng trong cuộc đua AI có thể định hình những câu chuyện mà các nhà sử học kể về quá khứ như thế nào trong tương lai gần không phải là quá sớm.

Trong số các nhà sử học mà tôi đã nói chuyện, một trong những người thử nghiệm nhiệt tình hơn là Fred Turner, người giảng dạy tại khoa truyền thông của Stanford. Tôi đến văn phòng của ông mong muốn phỏng vấn ông về việc AI phù hợp như thế nào với lịch sử lâu đời của công nghệ thông tin, nhưng chúng tôi cuối cùng đã dành phần lớn thời gian thảo luận về cách ChatGPT đã giúp ông với dự án sách mới nhất của mình, xoay quanh bối cảnh nghệ thuật Thành phố New York vào những năm 1970 và 1980.

Ông đang ở giai đoạn mà ông gọi là “dàn ý nguồn” — nghĩa là một tài liệu khoảng 100 trang tập hợp tất cả nghiên cứu của ông, “được sắp xếp ít nhiều theo mạch của cuốn sách mà tôi nghĩ nó sẽ trở thành.” Từ đó, ông dự định viết một đề xuất, nhưng ông nghĩ mình sẽ hỏi ChatGPT trước. Để đáp lại, chatbot đã đưa ra một cấu trúc tám chương hợp lý, chau chuốt, làm nổi bật những kết nối hữu ích trong nghiên cứu của ông và cũng gợi ý một cách kể chuyện hợp lý hơn cho dự án.

Ngoài ra, ông nói, “những gì nó làm là đọc lại những tác phẩm học thuật khá hàn lâm của tôi bằng một giọng điệu bình dân hơn. Nó tìm ra mức trung bình trong tác phẩm của tôi, điều này thực sự thú vị.” Ông tiếp tục: “Nó gần như thể tôi được mang cuốn sách ra thị trường và đứng trong hiệu sách, giơ nó lên trước một đám độc giả quan tâm nhưng không chuyên và nhờ họ cho tôi biết điều gì hiệu quả và điều gì không.”

AI và Nghiên Cứu Lịch Sử: Những Bước Tiên Phong

Có một số học giả đang bắt đầu chính thức đưa việc sử dụng các mô hình ngôn ngữ lớn (LLM) vào công việc của họ. Một trong số đó là Mark Humphries, giáo sư tại Đại học Wilfrid Laurier ở Ontario, với các dự án nghiên cứu liên quan đến kho lưu trữ khổng lồ các hồ sơ số hóa từ lịch sử Canada. Trong một dự án, ông và các sinh viên của mình đã sử dụng AI để phân tích hàng chục nghìn hồ sơ viết tay về hoạt động buôn bán lông thú cuối thế kỷ 18 và đầu thế kỷ 19, nhằm hiểu rõ hơn về cộng đồng thương nhân rải rác (nay được gọi chung là “voyageurs”) những người, cùng gia đình, đã khám phá và sau này định cư phần lớn những gì cuối cùng sẽ trở thành Canada. “Nếu bạn có thể chuyển những hồ sơ đó cho một mô hình ngôn ngữ lớn và bạn có thể nói, ‘Hãy cho tôi biết những đối tác thương mại của Alexander Henry là ai,'” Humphries nói, “điều tuyệt vời là nó có thể rất nhanh chóng đi qua và không chỉ tìm kiếm theo tên mà còn thực hiện đối chiếu chéo, nơi bạn có thể tìm thấy các mối quan hệ.”

Mục tiêu không chỉ là tìm kiếm các giao dịch một đối một giữa các voyageurs cụ thể mà là các chuỗi liên kết mà các nhà nghiên cứu con người khó có thể thực hiện nhanh chóng. “Một AI mất 20 giây,” Humphries nói. “Một nghiên cứu sinh làm công việc tương tự có thể mất hàng tuần.”

Chắc chắn, Humphries — giống như Steven Johnson — đang bơi ở vùng nước sâu của thử nghiệm AI. Hầu hết các nhà sử học mà tôi liên hệ chỉ đang cẩn thận nhúng một ngón chân vào nước. Khi tôi liên hệ với Ada Ferrer, giáo sư Princeton và là tác giả của cuốn sách đoạt giải Pulitzer “Cuba: An American History”, bà đã trả lời một giờ sau đó để nói rằng bà vừa mới thử nghiệm với AI trong những tuần gần đây. “Tôi đang hoàn thành một cuốn sách và cảm thấy bí tên, vì vậy tôi đã hỏi ChatGPT,” bà viết. “Tôi liên tục tinh chỉnh câu lệnh của mình, bao gồm các chủ đề khác nhau, gợi ý về giọng điệu, v.v. Cuối cùng, nó có lẽ đã cho tôi khoảng 20 ý tưởng tên sách.” (Tuy nhiên, không có ý tưởng nào đủ tốt, và cuốn sách của bà vẫn chưa có tiêu đề.)

Ferrer đưa ra một nhận xét mà nhiều nhà sử học hàn lâm khác cũng đồng tình: rằng thái độ của họ đối với AI sống dưới cái bóng của việc sinh viên gian lận với nó, điều này đồng thời khiến họ miễn cưỡng chạm vào nó nhưng dường như cũng khiến họ hiểu được công cụ này mạnh mẽ đến mức nào. “Tôi bị ám ảnh bởi thực tế rằng việc tôi sử dụng AI sẽ là đạo đức giả khi tôi quan tâm đến việc sinh viên của mình sử dụng nó,” Jefferson Cowie của Vanderbilt, người đã giành giải Pulitzer năm 2023 cho cuốn sách “Freedom’s Dominion: A Saga of White Resistance to Federal Power,” cho biết. Nhưng ông nói thêm, “Tôi cũng biết rằng một vài người sẽ sử dụng nó một cách sáng tạo đáng kinh ngạc một khi chúng ta nắm bắt được nó.”

Thách Thức Lớn Nhất: Độ Chính Xác của AI

Câu hỏi hiển nhiên xoay quanh tương lai của lịch sử AI — và tiện ích của công nghệ này cho tất cả các loại việc khác — là những bước tiến mà nó cần thực hiện để giải quyết vấn đề độ chính xác. Charles C. Mann, tác giả của “1491” và gần đây nhất là “The Wizard and the Prophet,” nói với tôi rằng ông đã thử nghiệm với nhiều mô hình khác nhau khi nghiên cứu một dự án sách mới về lịch sử miền Tây nước Mỹ, và chúng đã đưa ra một số gợi ý tuyệt vời, nhưng ông trở nên lo lắng về việc chúng dễ dàng đưa ra thông tin sai lệch đến mức nào. Mann so sánh điều đó với sự nghiêm ngặt của quy trình biên tập của con người: “Tôi chắc rằng bạn đã từng có khoảnh khắc đó, với tư cách là một nhà báo, khi một biên tập viên thông minh nói, ‘Khoan đã — điều này có hợp lý không?’ Và bạn nói, ‘Ôi trời, không phải.’ Đó là điều mà AI không thể làm được. Nó không có công cụ phát hiện điều vớ vẩn.”

Vào tháng 5 năm nay, The Times đã công bố những con số đáng lo ngại về việc, một cách khó hiểu, bất chấp tất cả những tiến bộ về khả năng mà các LLM khác đang đạt được, vấn đề “ảo giác” của chúng lại trở nên tồi tệ hơn: Ví dụ, trong một bài kiểm tra chuẩn, mô hình “lập luận” o3 mới của OpenAI đã đưa ra thông tin không chính xác 33% số lần, gấp đôi tỷ lệ của phiên bản tiền nhiệm. Đối với Johnson và nhóm của ông tại Google, sự tồn tại dai dẳng của vấn đề này xác nhận phương pháp tiếp cận của NotebookLM: Mặc dù công cụ này đôi khi trình bày sai những gì có trong nguồn của nó (và truyền lại lỗi từ các nguồn đó mà không có nhiều khả năng kiểm tra thực tế), nhưng việc giới hạn tài liệu nghiên cứu dường như giúp giảm bớt các loại bịa đặt hoàn toàn mà vẫn xuất hiện từ các chatbot lớn.

Mặc dù vậy, Johnson cũng tin rằng những ứng dụng thú vị nhất cho các LLM trong nghiên cứu phi hư cấu là những ứng dụng mà kết quả sẽ luôn được kiểm tra thực tế. Thay vì xem AI như một trợ lý nghiên cứu sinh viên đại học, ông hình dung nó giống như một đồng nghiệp từ một bộ phận khác hoặc có lẽ là một đại lý sách thông minh hay một biên tập viên có thể giúp ông nhìn thấy phiên bản thú vị nhất của những ý tưởng của chính mình. Cần lưu ý rằng, đối với các nhà sử học khác, đây khó mà là một viễn cảnh đầy cảm hứng. Khi tôi hỏi Stacy Schiff, tác giả của những cuốn tiểu sử nổi tiếng về Cleopatra và Véra Nabokov, về ý tưởng tham khảo AI về cách cấu trúc một tác phẩm văn học, bà trả lời, “Tìm đến AI để tìm cấu trúc dường như ít giống một sự gian lận hơn là một sự tước đoạt, giống như nhờ ai đó ăn món kem nóng của bạn vậy.”

Để trả lời câu hỏi AI có thể thay đổi cách viết và hiểu lịch sử như thế nào, việc xem xét các mô hình ngôn ngữ lớn (LLM) như một mắt xích mới nhất trong chuỗi dài những thay đổi về cách thức tổ chức tri thức của nhân loại là rất hữu ích. Ít nhất là từ thế kỷ thứ ba trước Công nguyên, khi Callimachus viết “Pinakes” – một bộ sách (hiện đã mất) liệt kê các tài liệu của thư viện nổi tiếng (hiện đã mất) ở Alexandria – nhân loại đã phát minh ra những hệ thống ngày càng tinh vi để điều hướng các kho thông tin quá lớn mà bất kỳ cá nhân nào cũng không thể tiếp nhận hết được.

Những hệ thống như vậy luôn có hai mặt khi nói đến nghiên cứu học thuật, một nhiệm vụ mà “hiệu quả” luôn có nguy cơ đồng nghĩa với việc làm tắt. Mục lục in trong sách, một công cụ có từ ít nhất là năm 1467, cho phép các học giả tìm tài liệu liên quan mà không cần đọc toàn bộ cuốn sách. Từ góc độ tri thức nhân loại, đó là một bước tiến tới thiên đường hay địa ngục? Ngay cả bây giờ, 558 năm sau, ai có thể nói được? Những đổi mới thúc đẩy sự tình cờ – chẳng hạn như hệ thống Dewey Decimal, nhờ đó một chuyến đi vào kệ sách để tìm một cuốn sách thường dẫn đến một khám phá khác, nổi bật hơn – gần như theo định nghĩa, phải bị ảnh hưởng bởi sự tùy tiện. Phân loại một cuốn sách về Tiểu đoàn Mariposa với “The Age of Gold” của Brands và các tựa sách khác về cơn sốt vàng (979.404), nó sẽ có một tập hợp “hàng xóm” rất khác so với nếu nó được phân loại là một cuốn sách về các nạn nhân của Tiểu đoàn (“Dân cư bản địa, nhiều bộ lạc,” 973.0497).

Sự trỗi dậy của máy tính và internet tất nhiên là một bước ngoặt chưa từng có trong lịch sử các công cụ viết lịch sử – tăng theo cấp số mũ lượng thông tin về quá khứ và đồng thời, năng lực của chúng ta để sàng lọc và tìm kiếm thông tin đó. Về mặt tâm lý, các văn bản và công cụ kỹ thuật số đã đẩy chúng ta vào một kỷ nguyên, trên hết, của “sự sẵn có”: cả theo nghĩa thông thường của từ đó (mọi thứ dường như đều có sẵn) và theo nghĩa khoa học xã hội của “thiên vị sẵn có,” theo đó chúng ta có thể tự lừa dối mình nghĩ rằng chúng ta có một bức tranh rõ ràng và đầy đủ về một chủ đề, bị choáng ngợp bởi lượng lớn các sự kiện hỗ trợ có thể xuất hiện chỉ với một tìm kiếm duy nhất, có chủ đích.

Ngay cả trong giới sử học hàn lâm, sự sẵn có này đã làm thay đổi các động cơ theo hướng mà AI có khả năng đẩy đi xa hơn nữa. Năm 2016, nhiều năm trước sự bùng nổ của LLM, nhà sử học Lara Putnam của Đại học Pittsburgh đã xuất bản một bài luận về những thành tựu nhưng cũng là những mối nguy hiểm của nghiên cứu kỹ thuật số dựa trên tìm kiếm. “Lần đầu tiên, các nhà sử học có thể tìm thấy mà không cần biết phải tìm ở đâu,” bà viết, trong một đoạn đặc biệt sâu sắc. “Công nghệ đã bùng nổ về phạm vi và tốc độ khám phá. Nhưng khả năng của chúng ta trong việc đọc chính xác các nguồn mà chúng ta tìm thấy, và đánh giá ý nghĩa của chúng, không thể magically tăng tốc theo kịp. Càng xa xôi những địa điểm được liên kết qua các khám phá của chúng ta, kiến thức ngữ cảnh của chúng ta càng ít nhất quán. Kiến thức đặc thù về địa điểm mà nghiên cứu lịch sử trong thế giới tiền kỹ thuật số yêu cầu không còn được tích hợp vào quá trình. Chúng ta mắc những lỗi nghiệp dư.”

Bài tiểu luận của Putnam không phải là một lời than vãn chống lại các công cụ kỹ thuật số — vốn có thể tạo ra cái mà bà gọi một cách đáng nhớ là “cái nhìn ngang,” khả năng để một nhà sử học có chuyên môn vững chắc trong một lĩnh vực có thể nhanh chóng nắm bắt các chủ đề khác. Tìm kiếm kỹ thuật số đã cho phép các nhà sử học tạo ra những kết nối thực sự, mạnh mẽ mà nếu không thì sẽ không thể thực hiện được. Nhưng bà lo lắng về những gì đang mất đi, đặc biệt là khi kho nguồn số hóa, dù không ngừng tăng lên, vẫn kiên quyết không đại diện đầy đủ: thiên về tiếng Anh và các quốc gia giàu có hơn các quốc gia nghèo, nhưng đặc biệt thiên về các nguồn “chính thức” (những nguồn được in hơn là viết tay, được lưu giữ trong các kho lưu trữ thể chế hơn là các kho lưu trữ nhỏ hơn hoặc ít chính thức hơn). “Nhìn vào quá khứ qua lăng kính của những gì có thể số hóa,” Putnam lưu ý, “làm cho một số hiện tượng trở nên nổi bật và những hiện tượng khác thì ít hơn, khiến một số người trở nên rõ nét một cách sống động và những người khác thì mờ nhạt đến mức biến mất.”

Khi bà và tôi trò chuyện gần đây, Putnam đã so sánh sự thay đổi này với căn bệnh chi phí của Baumol — hiện tượng, được nhà kinh tế William Baumol ghi nhận, rằng khi công nghệ làm cho một số công nhân hiệu quả hơn, nó sẽ làm cho các hình thức lao động khác trở nên đắt đỏ hơn và do đó khó biện minh hơn. Về nguyên tắc, Putnam lưu ý, các công cụ kỹ thuật số không có nhược điểm: Các nhà sử học chuyên nghiệp vẫn có đủ khả năng thực hiện nghiên cứu tốn thời gian trong các kho lưu trữ vật lý. Nhưng trên thực tế, loại nghiên cứu khác, nhanh hơn, kết nối hơn đang làm cho công việc truyền thống hơn dường như quá “đắt” về mặt chuyên môn khi so sánh. Tại sao phải dành cả tháng cắm trại trong một kho lưu trữ đầy bụi, không chắc chắn rằng bất cứ điều gì có thể xuất bản sẽ xuất hiện, trong khi thay vào đó bạn có thể đi theo những con đường trí tuệ thực sự, mạnh mẽ thông qua vô số nguồn tài liệu dường như vô tận có thể truy cập thoải mái từ nhà?

Putnam chưa tự mình thử nghiệm nghiên cứu AI, và nỗi sợ hãi của bà tập trung vào kịch bản ác mộng cơ bản (và có lẽ đúng) rằng công nghệ này sẽ hủy hoại ngành lịch sử theo cùng một cách mà nó đang hủy hoại nghệ thuật viết luận của sinh viên, tức là bằng cách tạo ra các văn bản đủ hợp lý để khiến công việc của con người trở nên không liên quan. Nhưng ngay cả khi ác mộng đó được ngăn chặn và AI trở thành cộng tác viên của nhà sử học chứ không phải là sự thay thế của họ, rất dễ để thấy cách tóm tắt bằng AI có thể thay đổi cách viết phi hư cấu theo những hướng tương tự như những gì tìm kiếm kỹ thuật số đã làm. Các nguồn tài liệu riêng lẻ sẽ ngày càng mờ nhạt vào phía sau, khi người dùng tin tưởng các công cụ như NotebookLM để đưa ra các bản tóm tắt có vẻ mạch lạc của một kho tàng văn bản khổng lồ mà không cần nhiều sự chú ý đến nguồn gốc hoặc mục đích của chúng. Điều gì trở nên “rẻ” một cách đáng kinh ngạc, trong một thế giới như vậy, là công việc cố gắng tổng hợp một lượng lớn tài liệu đáng kinh ngạc, có lẽ dựa trên các nguồn vượt xa những gì một con người có thể xử lý trong đời, bao gồm nhiều ngôn ngữ, biên giới và thời kỳ, với tốc độ cho phép một con người hoàn thành nhiều dự án như vậy trong một sự nghiệp.

Tiềm Năng Thay Đổi Lớn Lao

Những mặt tích cực tiềm năng của sự thay đổi này không nên bị đánh giá thấp. Hiện tại, có lẽ kịch tính lớn nhất trong thế giới lịch sử đại chúng là câu hỏi liệu Robert Caro, 89 tuổi, có thể hoàn thành tập thứ năm và cuối cùng của bộ tiểu sử về Lyndon Johnson, một công trình khổng lồ đã tiêu tốn 50 năm cuộc đời ông hay không. Các tài liệu cá nhân của ông, một số đã được ông trao cho Hiệp hội Lịch sử New York, cho đến nay chiếm 150 feet dài các hộp tài liệu, và người ta tự hỏi Caro có thể đã tạo ra bao nhiêu cuốn tiểu sử đồ sộ khác trong 50 năm đó nếu một chatbot có thể tổng hợp một phần tài liệu đó cho ông. Thế nhưng, nếu không có nỗi ám ảnh phải tự tay chạm vào từng nguồn tài liệu, và không đổ hết sự tỉ mỉ của tất cả những nghiên cứu không ngừng nghỉ đó vào văn xuôi của mình, một Robert Caro được AI hỗ trợ sẽ không còn là Robert Caro nữa.

Trong các thử nghiệm của Steven Johnson với lịch sử cơn sốt vàng, kết quả đáng kinh ngạc nhất đến khi ông đưa một ý tưởng cấu trúc của riêng mình cho chatbot NotebookLM. Nó dựa trên sự say mê của Johnson với cái mà ông gọi là “long zoom” — một kiểu kể chuyện, giống như bộ phim tài liệu nổi tiếng của Charles và Ray Eames, “Powers of Ten,” di chuyển theo cấp số nhân về thời gian hoặc quy mô.

“Vừa nghĩ ra một cấu trúc hay ho cho cuốn sách này,” ông nói với chatbot. “Có lẽ phần lớn nó là một loạt các chương kể câu chuyện dẫn đến các sự kiện của Tiểu đoàn Mariposa” — tức là cuộc xâm lược Thung lũng Yosemite — “nhưng mỗi chương là một thang thời gian. Vì vậy Chương 1 có tên: một triệu năm trước; Chương 2 là một nghìn năm trước; Chương 3 là một trăm năm trước, v.v. v.v.: một thập kỷ, một năm, một tháng, một tuần, một ngày. Và rồi chiến tranh bắt đầu vào năm 1851. Và sau đó có một phần kết dài. Phác thảo nội dung của mỗi chương đó có thể là gì? Chúng ta sẽ kể phần nào của câu chuyện lớn trong phân đoạn đó?”

Johnson đã biết tại sao cấu trúc đó có thể hoạt động: bởi vì các thang thời gian đã ban tặng cho thung lũng những yếu tố then chốt của bi kịch (vàng, những con người đầu tiên, các dân tộc bản địa cụ thể giữa thế kỷ 19, những người định cư da trắng xâm lấn) trải dài qua tất cả các lũy thừa của 10 đó. Nhưng thật đáng kinh ngạc khi thấy rằng AI cũng nhận thức được tất cả những điều đó, mà không cần Johnson phải nói cho nó biết:

Cấu Trúc Sách Đề Xuất Bởi AI

Một Triệu Năm Trước: Sự hình thành địa chất của Sierra Nevada, sự tạo thành các mỏ vàng và sự hình thành Thung lũng Yosemite do hoạt động băng hà.
Một Nghìn Năm Trước: Những cuộc di cư ban đầu của con người và sự hình thành các nền văn hóa bản địa ở Sierra Nevada, tập trung vào sự thích nghi của họ với môi trường.
Một Trăm Năm Trước: Cuộc sống của tổ tiên người Yosemite Indians, các mối quan hệ giữa các bộ lạc, những tiếp xúc ban đầu với người châu Âu và những tác động ban đầu của dịch bệnh.
Một Thập Kỷ Trước: Sự hiện diện ngày càng tăng của người Mỹ ở California, Chiến tranh Mexico-Mỹ, việc sáp nhập California và những tin đồn ban đầu về vàng.
Một Năm Trước: Việc phát hiện vàng tại Sutter’s Mill, dòng người đổ xô nhanh chóng tìm vàng, sự thành lập các khu khai thác và những dấu hiệu đầu tiên của xung đột với các bộ lạc người Mỹ bản địa. Giới thiệu các nhân vật chủ chốt như James Savage và Chief Tenieya.
Một Tháng Trước: Căng thẳng leo thang, các cuộc đột kích vào các trạm giao dịch, sự hình thành các đội dân quân định cư và những nỗ lực đàm phán thất bại dẫn đến Chiến tranh Mariposa.
Một Tuần Trước: Sự tổ chức và di chuyển của Tiểu đoàn Mariposa, quan điểm của người Yosemite Indians khi xung đột sắp xảy ra.
Một Ngày Trước: Những giờ cuối cùng trước khi Chiến tranh Mariposa bùng nổ, tập trung vào trạng thái tâm lý và kỳ vọng của các cá nhân ở cả hai phía.

Đầu mùa xuân này, tôi đã đến thăm Johnson tại khuôn viên của Google ở Mountain View, California, để cập nhật tiến độ của ông. Johnson vẫn giữ cách tiếp cận “powers-of-ten” mang tính vũ trụ của mình, và ông hiện đang cố gắng tinh chỉnh ý tưởng cho chương đầu tiên của mình, chương lấy bối cảnh một triệu năm trước năm 1851. Ông nói với tôi rằng ông đã bị ám ảnh bởi cây sồi California, với quả sồi là một trong những nguồn lương thực chính cho phép các nhóm người bản địa sớm nhất định cư ở thung lũng.

Khi tôi ngồi xuống với Johnson trong phòng họp, ông đã cho tôi xem tính năng “sơ đồ tư duy” mới của NotebookLM, tính năng này tự động tạo một cây khái niệm từ tài liệu nguồn của bạn, cho phép bạn khám phá theo chủ đề mà không cần phải viết các truy vấn cụ thể. Ông quan tâm đến một hiện tượng gọi là “masting” (mùa ra quả đồng loạt), trong đó cây sồi đồng bộ để ra một lượng lớn quả sồi trong một mùa, và ông đã thêm một nhóm tài liệu về masting vào công cụ. Sau đó, ông tạo một sơ đồ tư duy cho chúng, tạo ra các nhánh chủ đề khác nhau về hiện tượng này: ví dụ, chủ đề “Các giả thuyết về Masting” phân nhánh để bao gồm “Giả thuyết bão hòa kẻ săn mồi,” “Giả thuyết hiệu quả thụ phấn” và nhiều hơn nữa. Johnson thấy tiện ích của tất cả những điều này tương tự như cách Putnam nói về “cái nhìn ngang”: “Tôi không cần phải là một chuyên gia về quả sồi, nhưng tôi muốn có hai đoạn văn về quả sồi.”

Tại trung tâm Mountain View này, việc hiểu NotebookLM như chỉ là một trong số các công cụ AI mà gã khổng lồ công nghệ đang phát triển, tất cả đều xoay quanh chủ đề sáng tạo, trở nên dễ dàng hơn. Chỉ trong vài tháng, bộ phận DeepMind của công ty sẽ giới thiệu VEO 3, có thể tạo ra các video độ phân giải cao với âm thanh chân thực hoàn toàn từ các câu lệnh do người dùng viết. Flow, một dự án video khác trong Google Labs, đang giúp các nhóm nhà làm phim trẻ tạo các yếu tố AI cho dự án của họ, cho phép họ tiếp cận, chẳng hạn như, một mức độ hoạt hình hoặc bối cảnh kỳ lạ từ khắp nơi trên thế giới mà họ không thể đủ khả năng nếu không có nó.

Johnson và tôi có thêm Josh Woodward, người đứng đầu Google Labs, người nói với tôi rằng ông coi AI có khả năng hỗ trợ các dự án sáng tạo theo hai cách: Thứ nhất, nó có thể “hạ thấp rào cản,” giúp mọi người thực hiện các dự án mà họ không thể làm được nếu không có, dù là do thiếu tài nguyên, thiếu đào tạo hay cả hai; và thứ hai, nó có thể “nâng cao giới hạn,” giúp các nhà sáng tạo đã có tên tuổi đưa dự án của họ lên một tầm cao mới. Về việc “nâng cao giới hạn,” bộ phận này đang làm việc với các tài năng Hollywood (“bạn sẽ biết tên họ”) để sử dụng AI trên các cảnh quay cụ thể trong các bộ phim lớn: “Tất nhiên có một khía cạnh kinh tế trong đó,” Woodward nói, nhưng những nhà sáng tạo đã có tên tuổi này cũng thấy công nghệ cho phép họ “khám phá rất nhiều câu chuyện khác, rất nhanh.”

Tương Lai Của Nền Kinh Tế Sáng Tạo và Lịch Sử AI

Những công cụ này, cùng với những công cụ đang được phát triển ở những nơi khác trong Thung lũng Silicon, rõ ràng có khả năng đẩy nền kinh tế sáng tạo vào tình trạng hỗn loạn lớn hơn nữa. Ngoài ra, nhiều công cụ trong số chúng — đặc biệt là các công cụ tạo video đáng kinh ngạc — dường như có khả năng đẩy nhanh những thay đổi văn hóa đã khiến việc viết nghiêm túc ngày càng ít liên quan trong kỷ nguyên internet. Có lẽ thật ngây thơ khi thậm chí lo lắng về việc AI cạnh tranh với các nhà sử học, khi người dùng thông thường, giữa một cuộc sống ngày càng bị tiêu tốn bởi những thú tiêu khiển không lời khác, hài lòng khi nhận được các sự kiện theo yêu cầu dưới dạng những mẩu tin ngắn gọn.

Cả Woodward và Johnson dường như đều nhận thức được tiềm năng hủy diệt của dự án của họ. Trong các công cụ mà Labs thiết kế, họ đã cố gắng giữ lợi ích của những người sáng tạo con người ở vị trí hàng đầu. Johnson đã suy nghĩ từ đầu về cách các nhà sử học và các tác giả khác có thể kiếm tiền thông qua ứng dụng. Trong cuộc trò chuyện của chúng tôi ở Mountain View, ông đã đưa ra một nguồn doanh thu mới khả thi: Điều gì sẽ xảy ra nếu sách điện tử về lịch sử được tăng cường với giao diện giống NotebookLM?

Hãy tưởng tượng, ông tiếp tục, rằng “có một phiên bản tuyến tính của câu chuyện với các chương,” nhưng sau đó các tài liệu chính mà tác giả đã sử dụng để viết cuốn sách cũng được đóng gói kèm theo. Bằng cách đó, “thay vì chỉ có một danh mục tài liệu tham khảo, bạn có một bộ sưu tập trực tiếp tất cả các nguồn gốc” để một chatbot khám phá: cung cấp dòng thời gian, “sơ đồ tư duy,” giải thích các chủ đề chính, bất cứ điều gì bạn có thể nghĩ ra để hỏi.

Đây có lẽ là viễn cảnh “đau não” nhất của lịch sử AI, trong đó một tác nhân thông minh giúp bạn viết một cuốn sách về quá khứ và sau đó vẫn gắn liền với cuốn sách đó trong tương lai vô định, mãi mãi giúp khán giả của bạn diễn giải nó. Từ góc độ tri thức nhân loại, đó là thiên đường hay địa ngục? Ai có thể nói được?

Bill Wasik (giám đốc biên tập)

____________________

Phụ Lục: Thuật Ngữ, Nhân Vật và Thông Tin Khác

(Do Gemini và T.Vấn thực hiện)

Dưới đây là danh sách các thuật ngữ, nhân vật, và khái niệm quan trọng được đề cập trong bài báo, cùng với giải thích ngắn gọn để độc giả tiện theo dõi:

A. Thuật Ngữ & Khái Niệm

A.I. (Artificial Intelligence – Trí tuệ nhân tạo): Là trí tuệ do máy móc tạo ra, có khả năng thực hiện các tác vụ đòi hỏi sự thông minh của con người như học hỏi, giải quyết vấn đề, hiểu ngôn ngữ, và ra quyết định. Trong bài báo, AI được đề cập đến khả năng đọc, tóm tắt và hỗ trợ viết lách, đặc biệt là trong lĩnh vực lịch sử.
LLM (Large Language Model – Mô hình ngôn ngữ lớn): Là một loại AI được huấn luyện trên lượng dữ liệu văn bản khổng lồ, cho phép nó hiểu, tạo ra văn bản giống con người, và thực hiện nhiều tác vụ liên quan đến ngôn ngữ như dịch thuật, tóm tắt, trả lời câu hỏi. ChatGPT và NotebookLM là ví dụ về LLM được nhắc đến.
NotebookLM: Một ứng dụng của Google dành cho nhà nghiên cứu và nhà văn, cho phép người dùng tải lên tài liệu nguồn và AI sẽ chỉ dựa vào những tài liệu đó để cung cấp thông tin hoặc hỗ trợ. Điểm khác biệt chính là nó không lấy dữ liệu từ toàn bộ internet mà tập trung vào các nguồn do người dùng chọn.
ChatGPT: Một chatbot AI nổi tiếng của OpenAI, có khả năng hiểu và phản hồi đa dạng các câu hỏi, thực hiện nhiều tác vụ sáng tạo dựa trên dữ liệu khổng lồ mà nó được đào tạo từ internet.
Mind Map (Sơ đồ tư duy): Một công cụ trực quan hóa thông tin, giúp tổ chức và thể hiện các ý tưởng, khái niệm theo cấu trúc phân nhánh từ một chủ đề trung tâm. Trong bài báo, NotebookLM có tính năng tự động tạo sơ đồ tư duy từ tài liệu nguồn.
Masting (Mùa ra quả đồng loạt): Một hiện tượng sinh học trong tự nhiên, đặc biệt là ở cây sồi, khi cây trong một quần thể đồng bộ ra một lượng lớn quả (ví dụ: quả sồi) trong một mùa duy nhất, thường không đều đặn hàng năm.
Long Zoom: Một phương pháp kể chuyện, do Steven Johnson đề xuất, di chuyển theo cấp số nhân về thời gian hoặc quy mô. Ví dụ như kể về lịch sử một địa điểm từ hàng triệu năm trước đến từng ngày. Khái niệm này được lấy cảm hứng từ bộ phim tài liệu “Powers of Ten” của Charles và Ray Eames.
Baumol’s Cost Disease (Căn bệnh chi phí của Baumol): Một hiện tượng kinh tế được nhà kinh tế William Baumol ghi nhận. Nó chỉ ra rằng khi công nghệ giúp một số ngành/người lao động trở nên hiệu quả hơn (và do đó rẻ hơn tương đối), các hình thức lao động khác không thể tăng năng suất tương ứng sẽ trở nên đắt đỏ hơn và khó biện minh hơn về mặt chi phí. Trong bài báo, nó được dùng để ví dụ cho việc nghiên cứu lịch sử truyền thống có thể trở nên “đắt đỏ” hơn so với nghiên cứu kỹ thuật số.
Availability Bias (Thiên vị sẵn có): Một loại thiên kiến nhận thức, trong đó con người có xu hướng đánh giá quá cao xác suất của các sự kiện hoặc thông tin dễ dàng xuất hiện trong tâm trí họ. Trong bối cảnh internet, nó có thể khiến người viết cảm thấy mình đã có bức tranh đầy đủ về một chủ đề vì có quá nhiều thông tin dễ tìm thấy, dù thực tế có thể không phải vậy.
Sideways Glance (Cái nhìn ngang): Khả năng mà các công cụ kỹ thuật số mang lại cho các nhà sử học, giúp họ nhanh chóng nắm bắt các chủ đề ngoài lĩnh vực chuyên môn chính của mình để có cái nhìn tổng quan.
Hallucination (Ảo giác của AI): Hiện tượng khi AI tạo ra thông tin không chính xác, bịa đặt hoặc không có cơ sở trong dữ liệu mà nó được đào tạo hoặc được cung cấp. Đây là một vấn đề lớn về độ chính xác mà các mô hình AI hiện tại đang gặp phải.

B. Nhân Vật Nổi Bật

Bill Wasik: Tác giả của bài báo, giám đốc biên tập của tạp chí, người đã có 25 năm kinh nghiệm trong ngành xuất bản. Ông là người chia sẻ những quan sát của mình về ảnh hưởng của AI.
Steven Johnson: Nhà báo công nghệ và nhà sử học nổi tiếng, từng xuất bản nhiều cuốn sách lịch sử phổ biến. Ông là một trong những người tiên phong thử nghiệm NotebookLM cho việc nghiên cứu lịch sử và là giám đốc biên tập của bộ phận Google Labs.
H.W. Brands: Tác giả của cuốn sách lịch sử “The Age of Gold” về cơn sốt vàng California, được Steven Johnson sử dụng làm nguồn tham khảo ban đầu.
Lafayette Houghton Bunnell: Tác giả của “Discovery of the Yosemite”, thành viên của Tiểu đoàn Mariposa, một nguồn tài liệu cũ được Johnson sử dụng.
Maria Lebrado: Cháu gái của thủ lĩnh Yosemite Teneiya, một trong 72 người bản địa bị buộc rời thung lũng năm 1851. Cô được Steven Johnson nhận diện là một nhân vật tiềm năng cho cuốn sách của mình nhờ thông tin do AI cung cấp.
Fred Turner: Giáo sư khoa truyền thông tại Stanford, một trong những nhà sử học nhiệt tình thử nghiệm ChatGPT để hỗ trợ dự án sách của mình về cảnh nghệ thuật New York.
Mark Humphries: Giáo sư tại Đại học Wilfrid Laurier (Ontario), người sử dụng AI để phân tích các hồ sơ viết tay về hoạt động buôn bán lông thú thế kỷ 18-19 tại Canada.
Ada Ferrer: Giáo sư Princeton và là tác giả của cuốn sách đoạt giải Pulitzer “Cuba: An American History.” Bà cũng đã thử nghiệm ChatGPT để tìm ý tưởng tiêu đề sách.
Jefferson Cowie: Giáo sư Vanderbilt, người đã giành giải Pulitzer cho cuốn sách “Freedom’s Dominion: A Saga of White Resistance to Federal Power.” Ông bày tỏ sự dè dặt về việc sử dụng AI do lo ngại về việc sinh viên gian lận.
Charles C. Mann: Tác giả của các cuốn sách nổi tiếng như “1491” và “The Wizard and the Prophet.” Ông đã thử nghiệm AI trong nghiên cứu nhưng lo ngại về vấn đề “ảo giác” (thông tin sai lệch).
Lara Putnam: Nhà sử học của Đại học Pittsburgh, tác giả của bài tiểu luận về những lợi ích và nguy hiểm của nghiên cứu kỹ thuật số. Bà nhấn mạnh rằng các nguồn số hóa vẫn chưa đại diện đầy đủ và có thể dẫn đến “lỗi nghiệp dư.”
Robert Caro: Nhà viết tiểu sử nổi tiếng, người đã dành 50 năm để viết bộ tiểu sử về Lyndon Johnson. Ông được nhắc đến như một ví dụ về sự tận tâm nghiên cứu thủ công mà AI có thể không thay thế được.
Stacy Schiff: Tác giả của các cuốn tiểu sử xuất sắc về Cleopatra và Véra Nabokov. Bà thể hiện sự không tán thành mạnh mẽ với việc sử dụng AI để hỗ trợ cấu trúc viết.
Josh Woodward: Người đứng đầu Google Labs, người tin rằng AI có thể “hạ thấp rào cản” và “nâng cao giới hạn” cho các dự án sáng tạo.

C. Địa Danh & Tổ Chức

Manhattan West Side: Khu vực phía Tây của Manhattan, New York, nơi có căng tin của Google được nhắc đến trong bài báo.
Hudson (River): Sông Hudson, chảy qua New York, nơi Steven Johnson và tác giả nhìn cảnh hoàng hôn.
Yosemite Valley (Thung lũng Yosemite): Một thung lũng sông băng nổi tiếng ở Sierra Nevada, California, là bối cảnh chính cho dự án sách về cơn sốt vàng của Steven Johnson.
Mariposa Battalion (Tiểu đoàn Mariposa): Một đơn vị dân quân tham gia vào việc trục xuất người dân bản địa khỏi Thung lũng Yosemite vào năm 1851.
Central Valley: Một thung lũng lớn và màu mỡ ở California.
Google Labs: Bộ phận của Google chuyên về các dự án thử nghiệm và đổi mới, nơi Steven Johnson là giám đốc biên tập.
Mountain View, Calif.: Thành phố ở California, nơi đặt trụ sở chính của Google.
Stanford (University): Đại học Stanford, nơi Fred Turner giảng dạy.
Wilfrid Laurier University: Một trường đại học ở Ontario, Canada, nơi Mark Humphries giảng dạy.
Princeton (University): Đại học Princeton, nơi Ada Ferrer là giáo sư.
Vanderbilt (University): Đại học Vanderbilt, nơi Jefferson Cowie là giáo sư.
New York Historical (Society): Hiệp hội Lịch sử New York, nơi Robert Caro đã tặng một phần tài liệu cá nhân của mình.
JSTOR: Một thư viện số trực tuyến chứa các bài báo khoa học, sách và các tài liệu học thuật khác.

Gemini

Gemini (Google Gemini) không phải là một con người, một tổ chức bằng xương bằng thịt để chịu trách nhiệm những sai sót (sẽ phải có). Để bảo đảm tính chính xác (dựa trên văn bản gốc), dịch gỉa T.Vấn sẽ chịu trách nhiệm hiệu đính, sửa chữa (nếu cần) mỗi bài báo, tài liệu được đăng tải trong chuyên mục.

T.Vấn

& Bạn Hữu

Văn Học và Đời Sống

A.I. Sẵn Sàng Viết Lại Lịch Sử. Theo Nghĩa Đen

Gemini

Bài Mới Nhất

t-van.net © 2024
All images © their rightful owners