TRÍ KHÔN NHÂN
TẠO (ARITFICAIL INTELLIGENCE - AI)
Phần II
Đông Yên - Master, Computer Science
(Phỏng theo John McArthy và một số tài liệu Tin Học khác)
*** WARNING:: This article may be used, and only used, for educational
and/or non-commercial purposes
provided it is used as is, i.e., with proper citation and without
modifications whatsoever.
Trí Khôn Nhân Tạo
(Aritficial intelligence - Ai) là trí khôn của máy móc. Từ ngữ nầy cũng dùng để đặt tên cho một bộ môn
của Khoa Học Điện Toán. Hầu hết các sách
giáo khoa về Trí Khôn Nhân Tạo định nghĩa bộ môn nầy là “công trình nghiên cứu
và thiết kế những tác nhân tinh khôn (study and design of intelligent
agents)”. Tác nhân thông minh là một hệ
thống nhận định hiện trường và thực hiện những hành động nhằm tối ưu hóa cơ may
thành công. John McArthy, người sữ dụng
từ ngữ nầy vào năm 1956, định nghĩa nó như là “khoa học và công nghệ sản xuất
máy móc tinh khôn (science and engineering of making intelligent
machines)”.
Bộ môn được thành lập dựa
trên luận đề là một thuộc tính (property) của con người, tức sự thông minh – sapience
trong Homo sapiens – có thể được mô tả chính xác đến mức độ máy móc có
thể mô phỏng theo được. Luận đề nầy gây
ra những tranh cải triết hóc liên quan đến bản chất của tinh thần (mind) và
giới hạn đối với niềm tự hào của khoa học.
Các đề tài tranh cải nầy đã từng được đề cập qua thần thoại, giả tưởng
và triết học từ ngàn xưa. Trí Khôn Nhân
Tạo từng là đề tài của bao lạc quan tột đỉnh, từng kinh qua những nghịch biến
điên đảo, và ngày nay đã trở nên một bộ phận thiết yếu trong công nghệ kỹ
thuật, cung ứng một lực đẩy ngàn cân cho các vấn đề nan giải nhất trong Khoa
Học Điện Toán.
Công tác nghiên cứu Trí Khôn Nhân Tạo nặng về kỹ thuật và chuyên
biệt hóa đến độ một số nhà phê bình phản đối việc xé nát bộ môn ra quá nhiều
chi hệ như vậy. Các chi hệ của khoa Trí
Khôn Nhân Tạo được tổ chức chung quanh những vấn đề đặc thù, việc áp dụng những
dụng cụ đặc thù, và chung quanh những dị biệt cố hữu về quan điểm Lý
thuyết. Các vấn đề trọng tâm của Trí
Khôn Nhân Tạo bao gồm những đặc tính như lý luận (resoning), nhận thức
(knowledge), thiết kế (planning), tìm hiểu (learning), truyền thông
(communication), tri thức (perception) và khả năng di chuyển và điều động vật
thể (move and manipulate objects).
1.
Viễn tượng của TKNT (Trí Khôn Nhân Tạo) – Perspectives on
AI
1.1.
TKNH trong thần thoại, giả tưởng và suy đoán
1.2.
Lịch sử nghiên cứu TKNT
1.3.
Triết lý của TKNT
2.
Nghiên cứu TKNT
2.1 Những vấn đề của TKNT
2.1.1 Diển dịch, suy luận, và
giải quyết vấn đề (Deduction, reasoning, and problem solving)
2.1.2 Lập định tri thức
(Knowledge representation)
2.1.3 Hoạch định (Planning)
2.1.4 Học hỏi (learning)
2.1.5 Xữ lý ngôn ngữ tự nhiên
(natural language processing)
2.1.6 Di chuyển và điều động
(motion and manipulation)
2.1.7 Tri giác (Perception)
2.1.8 Trí khôn xã hội (social
intelligence)
2.1.9 Sáng tạo (creativity)
2.1.10 Trí Khôn Toàn Năng
(General Intelligence)
2.2 Phương pháp
của khoa TKNT (Approches to AI )
2.2.1
Điều Động Học và nảo bộ nhân tạo (Cybernetics and brain simulation)
2.2.2
TKNT biểu tượng cổ điển (Traditional symbolic AI)
2.2.3
TKNT biểu tượng thứ cấp (Sub-symbolic AI)
2.2.4
Mô hình tác nhân tinh khôn (Intelligent agent paradigm)
2.2.5
Tổng hợp các phương pháp (Integrating the approaches)
2.3
Phương tiện nghiên cứu TKNT (Tools of AI research)
2.3.1
Nghiên cứu và tối ưu hóa (Research and optimization)
2.3.2
Luận lý (Logic)
2.3.3
Phương pháp sát xuất trong suy luận bất xác
(Probabilistic methods for uncertain reasoning)
2.3.4
Phân loại và phương pháp nghiên cứu thống kê (classifiers
and statistical learning methods)
2.3.5
Ngôn ngữ chuyên đề (Specilized languages)
2.4
Đánh giá TKNT (Evaluating artificial intelligence)
2.2
Phương pháp của khoa
TKNT (Approches to Ai )
Bộ môn
TKNT không có một Lý thuyết hay mô hình chỉ đạo thống nhất khách quan. Các nhà nghiên cứu không đồng ý với nhau trên
nhiểu vấn đề. Sau đây là một số những
câu hỏi dai dẳng nhất chưa được trả lời:
Trí thông minh có thể được mô phỏng dựa trên những ký hiệu trừu tượng
cao cấp như lời nói và tư tưởng hay không(words and ideas)? Hay đòi hỏi phải có biến trình ký hiệu thứ cấp (sub-symbolic
processing)? Trí khôn nhân tạo nên mô
phỏng trí khôn thiên tạo bằng cách nghiên cứu tâm lý con người hay thần kinh động vật học (human psycology or animal
neurobiology)? Có đúng là giữa Sinh học về con người và khoa TKNT không có liên quan gì cũng như
tương quan giữa sinh học về chim và khoa học không gian? Hành vi tinh khôn có thể được mô tả bằng cách
sữ dụng những nguyên tắc đơn giản, lịch sự như luận lý học hay hạch toán tối ưu
(logic or optimization)? Hay TKNT nhất
thiết phải cần giải quyết nhiều vấn đề ngoại vi không liên quan?
2.2.1
Điều Động Học
và nảo bộ nhân tạo (Cybernetics and brain simulation)
Trong
những thập niên 40 và 50, một số nhà khảo cứu đã tìm hiểu mối tương quan giữa
Thần kinh Học (Neurology*), Lý thuyết
Thông Tin (information Theory**), và
Điều Động Học (Cybernetics***).
Neurology
(Thần Kinh Học) là một ngành chuyên môn
của y khoa chuyên trị những rối loạn của hệ thống thần kinh, Nói rõ hơn, ngành nầy chẩn đóan và chửa trị
tất cả những loại bệnh liên quan đến những hệ thống thần kinh tự phát, trung
ương và phụ cận (central, peripheral, and autonomic nervous systems), bao gồm
những phần bao bọc, mạch máu, và toàn bộ cơ phận tác động (effector tissue) như
cơ bắp.
Information Theory (Lý thuyết Thông Tin) là một ngành của toán học ứng dụng và công nghệ điện nhằm nghiên cứu nội dung
thông tin. Theo lịch sử, Lý thuyết nầy được phát triển để tìm ra những giới hạn
cơ bản khi nén dữ kiện và truyền tải dữ kiện đi một cách chính xác. Từ khi mới thành lập, ngành nầy đã mở rộng để
đưa các ứng dụng vào nhiều lảnh vực khác như luận suy thống kê (statistical
inference), xử lý ngôn ngữ tự nhiên, mật mã, những hệ thống phi truyền tin, tiến
hóa và chức năng của mã số phân tữ (molecular codes), lựa chọn biểu mẫu trong
sinh thái học, vật lý nhiệt học (thermal physics), vật lý lượng tữ (quantum),
thám sát đạo văn (plagierism detection), và các hình thức phân tích dữ kiện
khác.
Những khái niệm chính của Lý
thuyết Thông Tin có thể hình dung được qua xem xét phương tiện truyền thông phổ
cập nhất của con nguời: ngôn ngữ. Hai mặt chủ yếu của một ngôn ngữ tiêu chuẩn gồm
có như sau: Thứ nhất, những từ thông
thường nhất (như, trong tiếng Anh chẳng hạn, “a”, “the”, “I”) phải ngắn hơn
những từ ít thông thường hơn (như “benefit”, “generation”,”mediocre”); như thế
các câu sẽ không qúa dài. Một đánh đổi
như thế về chiều dài của từ ngữ tương ứng với kỹ thuật thu nén dữ kiện (data
compression*) và là yếu tố chủ yếu của kỹ thuật đó, đồng nghĩa với từ “source
coding (thiết lập mã ngữ)”. Thứ hai,
nếu phần nào đó của câu không nghe được hay nghe không rõ vì nhiểu sóng thì bên
nghe vẫn có thể nối kết được nghĩa của thông điệp bên dưới. Để giải qưyết trường hợp nầy Lý thuyết Thông
Tin sữ dụng một đơn vị đo lường gọi là entropy**. Kiện năng (robustness) đó đóng vai trò chủ
yếu trong một hệ thống truyền thông cũng
như trong một ngôn ngữ. Thực hiện một
kiện năng như thế trong truyền thông là nhiệm vụ của kỹ thuật mã hóa trên kênh
(Channel coding***), một trong hai thành tố chủ lực của Lý thuyết Thông
Tin. Cũng cần lưu ý là những kỹ thuật
nầy không liên quan đến tầm quan trọng của thông điệp được gởi. Nói hay viết một câu xã giao thông thường như
“Xin cám ơn; mong được gặp lại”
hay yêu cầu cấp cứu như “Hãy gọi xe cứu thương” cũng chiếm một chổ chứa
gần như nhau. Nói cách khác, Lý thuyết
Thông Tin chĩ quan tâm đến lượng (quantity) chứ không phải phẩm (quality) của
thông điệp.
Nảo bộ nhân tạo (Brain simulation): Bộ óc có thể mô
phỏng. Hans Moravec, Ray Kursweil và
những người khác cho rằng vế mặt kỹ thuật có thể sao chép bộ óc trực tiếp vào
nhu liệu và thiết bị vi tính, và một mô phỏng như vậy cơ bản sẽ tương tự như
bản gốc. Thuyết nầy kết hợp thuyết cho
rằng một máy với hiệu năng cao thích hợp có thể mô phỏng bất kỳ một tiến trình
nào với thuyết duy vật cho rằng tinh thần chĩ là hệ quả cuả những tiến trình
vật lý trong nảo bộ.
* Data Compression or
Source Coding là quá trình mã hoá thông tin bằng những kế sách đặc biệt
(specific coding scheme) sữ dụng số lượng đơn âm điện tữ (bits) hay đơn vị vi
tính nào khác ít hơn so với phương thức lập định thông tin không mã hóa. Những ví dụ gồm có thể nén ZIP, RAR, GZIP,
tất cả có nhiệm vụ chứa nhiều nguồn tài liệu trong cùng một địa chỉ. Cũng như bất kỳ hình thức truyền thông nào,
truyền tải dữ kiện chĩ hoạt động khi cả hai bên gởi và nhận đều hiểu được kế
sách mã hóa. Kỹ thuật thu nén dữ kiện rất hữu ích vì nó giúp giảm thiểu việc sữ
dụng tài nguyên vi tính cũng như thể tích đĩa hay dải tần truyền tải (hard disk
space or transmission bandwidth).
** Entropy là từ ngữ được dùng trong nhiều lảnh vực khác
nhau, không chĩ trong Lý thuyết Thông Tin.
Sau đây là một số những định nghỉa chính:
(1) Trong một hệ
thống động nhiệt học (thermodynamic system) entropy là một đơn vị đo lường số
lượng nhiệt năng không tham gia vào hoạt động của hệ thống.
(2) Trơng một hệ
thống biệt lập (closed system) entropy là đơn vị đo lường của sự rối loạn hay
bất định của hệ thống (disorder or randomness)
(3) Trong xã hội học entropy ám chỉ sự suy thoái
(deterioration) của một hệ thống hay xã hội
(4) Trong khoa học
vật lý, entropy là khuynh hướng giả định của tất cả vật thể và năng lượng tiến
về tình trạng đồng dạng bất biến (inert uniformity)
(5) Trong Lý
thuyết Thông Tin entropy là một đơn vị đo lường độ bất xác (uncertainty) của
một biến số ngẩu nhiên (random variable), thường được biểu diển bằng con số
trung bình của những đơn âm điện tữ (bit) cần thiết để chứa hay truyền tải dữ
kiện, biến thiên theo độ sát xuất mà dữ kiện bao gồm một tập hợp tín hiệu nào
đó. Nói một cách đơn giản thì entropoy
là đơn vị dùng đo lường những thông tin bị mất trong thông điệp gởi
đi (measure of the loss of information).
Theo trực quan, đơn vị thông tin (enthropy) định lượng hóa ước số bất
xác (quantifies the uncertainty) khi gặp phải một biến số ngẩu nhiên (random
variable). Ví dụ, giá trị bất xác sấp
hay ngửa của một đồng tiền bình thường chĩ giới hạn ở 2 ngẩu nhiên trong lúc
ngầu nhiên đó là 6 đối với một hột xí ngầu.
Theo Claude E. Shannon, đơn vị đo lường nầy là một giới hạn tuyệt đối
(absolute limit) của kỹ thuật thu nén dữ kiện tối ưu của truyền thông: xem những thông điệp mã hóa như là một liên
trình (sequence) những biến số ngẩu nhiên độc lập và phân phối đồng bộ
(sequence of independent and identically-distributed random variables).
Công thức mà Shannon dùng để tính entropy của thông điệp M truyền tải
bằng đơn âm (bits):
H(M) = -log2 p(M) // p(M) là sát xuất của M
Đơn vị entropy H của một biến số nguyên tố ngẩu nhiên X
(discrete random variable) là thước đo độ bất xác (uncertainty) của X. Giả thử thông điệp truyền đi gồm 1000 đơn âm
(bits). Nếu những đơn âm nầy được biết
trước khi truyền tải (tức có giá trị nhất định
0 hay 1 với sát xuất tuyệt đối – absolute probability) thì, theo luận
lý, không có thông tin nào được truyền
đi cả. Ngược lại, nếu mọi đơn âm (bit)
đều có khả thể đồng đều bằng 0 hay 1 và
độc lập với nhau, thì theo nghĩa luận lý, 1000 đơn âm được truyền tải. giữa hai cực biên đó (0 và 1000), thông tin
được định lượng như sau: Nếu là tập hợp những
thông điệp x trong đó có X, và p(x) là sát xuất của X dựa theo x, thì entropy
của X được định nghĩa như sau:
Entropy của X,
tức H(X), được biểu diển bằng giá trị ước tính (expected value: [I(x)]). Một đặc
tính quan trọng của entropy là nó mang giá trị lớn nhất (maximized) khi tất cả
thành tố n trong tập hợp đều có
sát xuất đồng đều (Equiprobable): p(x) = 1/n, nghĩa là khó tiên liệu nhất;
trong trường hợp nầy H(X) = logn.
*** Channel Coding
(Mã hóa trên kênh) Trong công nghệ điện, khoa học điện toán, và Lý thuyết
Thông Tin, thể tích kênh (channel capacity) là biên cực thượng lớn nhất
(tightest upper bound) của lượng thông tin có thể truyền đi một cách đáng tin
cậy qua kênh truyền thông. Theo định lý mã hóa kênh nhiểu (noisy-channel coding
theorem), thể tích của một kênh là lưu lượng thông tin lớn nhất (đơn vị thông
tin cho từng đơn vị thời gian ) có thể đạt được với sai suất nhỏ nhất
(arbitrarily small error probability). Kết quả chính cho thấy thể tích kênh như
được định nghĩa bên trên là thể tích thông tin hổ tương tối đa giữa nguồn vào
và nguồn ra (maximum of the mutual information between the input and output of
the channel). Khả năng tối đa hóa có
được là do sự phân phối của nguồn vào.
Channel coding chính thức được định nghĩa như sau:
Y
X
Giả sữ X là
không gian của những tín hiệu gởi đi và Y, không gian của những tín hiệu nhận
được trong một khung thời gian trên kênh.
Qua một số
bước toán học thống kê, Shannon đi đến công thức sau cùng cho thể tích kênh (C
- Channel capacity) như sau:
2.2.1
TKNT biểu
tượng cổ điển (Traditional symbolic AI)
Khi máy vi tính bắt đầu phổ cập vào giữa thập niên 1950,
công tác nghiên cứu TKNT bắt đầu thăm dò khả năng giản lược trí không con người
vào biến trình xữ lý biểu tượng (symbol
manipulation). Công tác nghiên cứu tập
trung tại ba Đại học: CMU, Stanford, and MIT; và mỗi đại học triển khai phương
án nghiên cứu riêng của mình.
Mô phỏng tri thức (cognitive simulation)
Kinh tế gia Herbert Simon và Alan Nowell nghiên cứu sở năng giải quyết vấn đề của con người và cố gắng hệ thống hóa chúng lại; và những công trình của họ đã đặt nền tảng cho bộ môn TKNT cũng như khoa học tri thức (cognitive science), nghiên cứu hoạt động (operation research*), và khoa học quản lý (management science). Toán nghiên cứu của họ thực hiện những thí nghiệm tâm lý để chứng minh sự tương đồng giữa phương thức mà con người giải quyết vấn đề và những lập trình điện toán mà họ đã triển khai (như “General Problem Solver”). Truyền thống nầy, tập trung tại Đại học Carnegie Mellon University, về sau đóng vai trò chủ yếu trong việc phát triển cơ cấu SOAR*** vào giữa thập niên 80.
* Operation research (Nghiên cứu hoạt động) là một ngành kết hợp giữa
toán học ứng dụng và khoa học qui phạm (formal science) được phát triển tại Bắc
Mỹ, Nam Phi, và Úc. Ngành nầy sữ dụng
những phương pháp như mô hình toán học, thống kê, va chương pháp (algorithm**)
để đạt được những giải pháp tối ưu hay gần như thế cho những vấn đề phức tạp. Vấn đề chủ yếu là làm sao đạt được trị số cực
đại (maxima) – như lợi tức, hiệu năng hoạt động, thu hoạch, dải tần v.v. – hay
giảm thiểu trị số cực tiểu (minima) – như lỗ lã, tai nạn .. - của một hàm số
khách quan nào đó (objective function).
Bộ môn nầy giúp công tác quản lý đặt được mục tiêu bằng cách sữ dụng những phương pháp khoa học.
** Algorithm (Chương pháp). Trong toán
học, vi tính, ngữ học và những đề tài liên hệ, Algorithm là một liên trình
(sequence) những chỉ đạo, thường được dùng cho tính toán và xữ lý dữ kiện (data
processing). Theo nghĩa khoa học mà nói thì đó là một phương pháp hiệu quả
(effective method) trong đó, từ một tình trạng ban đầu nhất định
nào đó, một liên trình những chỉ đạo được xác định rõ ràng sẽ tiến hành qua một
liên trình những tình trạng tương ứng, và cuối cùng sẽ chấm dứt ở một tình
trạng kết thúc (end-state) nào đó. Sự
chuyển tiếp từ tình trạng nầy sang tình trạng kế tiếp không nhất thiết có tính
cách tất định (deterministic); một số chương pháp, được gọi là chương pháp sát
xuất (probabilistic algorithms), bao gồm yếu tố ngẩu nhiên (randomness). Phương pháp hiệu quả (effective method)
cho một số vấn đề nhất định là một phương pháp trong đó mỗi bước có thể được
xem như là một hoạt động cơ hành (mechanical operation) và nếu tuân theo nghiêm
khắc và đến nơi đến chốn sẽ đưa đến những kết quả sau đây:
·
Luôn luôn cho ra một trả lời thay vì chẳng bao giờ có một trả lời nào
cả;
·
Luôn luôn cho câu trả lời đúng và chẳng bao giờ cho câu trả lời sai;
·
Luôn luôn hoàn tất trong một số bước nhất định thay vì không tiên liệu
được bao nhiêu bước;
·
Tập trung giải quyết những vấn đề nhất định đã đề ra.
*** SOAR (Symbolic cognitive architecture)
vừa tượng trưng cho tiến trình tri thức (cognition) vùa minh họa
tiến trình đó qua một cấu trúc lập trình vi tính dùng cho TKNT. Mục tiêu chính của dự án nầy là nghiên cứu
toàn bộ những khả năng của một tác nhân tinh khôn (intelligent agent), bao gồm
cả những vấn đề bỏ ngỏ thông thường lẫn khó khăn quyết liệt nhất. Muốn thế, theo quan điểm của cấu trúc nầy,
cần phải có khả năng tạo dựng những biểu trình (representations) và sữ dụng
những hình thái tri thức thích hợp, như tri thức vận hành (procedural), tri
thức thuyết ngôn (declarative), tri thức tự thuật (episodic), và có thể cả tri
thức yếu tính (iconic). Cấu trúc nầy từ
đó sẽ tìm hiểu một tập hợp nào đó những bộ máy của tinh thần. Mặc dù mục tiêu cuối cùng của dự án nầy là
đạt đến trí khôn toàn năng (general intelligence), chưa có một công bố nào cho
biết mục tiêu nầy đã được thực hiện hay chưa.
Những nhà thiết kế thừa nhận cấu trúc hãy còn thiếu một số mặt quan
trọng của trí thông minh.
TKNT Thuần lý (Logical AI)
Không giống như Newell và Simon, John McCarthy thấy rằng
máy móc không cần mô phỏng tư duy con người, nhưng ngược lại nên tìm ra yếu
tính của tư duy trừu tượng và phương thức gỉải quyết vấn đề, bất luận những
phương thức con người sữ dụng có giống nhau hay không.
TKNT Tượng Trưng Cụ Thể (scruffy symbolic AI)
Các nhà nghiên cứu tại Đại Học MIT thấy rằng giải quyết
những vấn đề khó khăn bằng thị giác và ngôn ngữ tự nhiên (in vision and natural
language) đòi hỏi phải có những giải pháp cá thể (ad-hoc solutions) - họ cho
rằng không có một nguyên tắc đơn giản và phổ quát nào (như luận lý chẳng hạn)
có thể áp dụng cho mọi khía cạnh của hành vi thông minh. Phương án nầy được mô tả như là phi luận lý
(anti-logic).
TKNT dựa vào trí thức dự trử (knowledge-based AI)
Khi máy vi tính đạt đuợc
những bộ nhớ lớn vào khoảng năm 1970, các nhà nghiên cứu từ mọi truyền
thống bắt đầu lắp đặt kiến thức dự trử vào những ứng dụng TKNT. Cuộc cách mạng kiến thức nầy đã dẩn đến việc
triển khai những hệ thống chuyên viên (expert systems), hình thức nhu liệu thực
sự thành công đầu tiên về TKNT. Cuộc
cách mạng kiến thức cũng bắt nguồn từ nhận định rằng ngay cả những ứng dụng
TKNT đơn giản cũng sẽ đòi hỏi những khối
lượng kiến thức khổng lồ.
2.2.2
TKNT biểu
tượng thứ cấp (Sub-symbolic AI)
Trong những thập niên 1960, những phương án biểu tượng
(symbolic approaches) đã thành công lớn trong việc mô phỏng tư duy cao cấp bằng
những lập trình biểu diển nhỏ. Những
phương án dựa trên điều động học (cybernetics) hay hệ thống thần kinh (neural
networks) đã bị bỏ rơi và đẩy vào hậu trường.
Tuy nhiên, vào những thập niên 60, tiến bộ trong TKNT biểu tượng dường
như dừng lại và nhiều người cho rằng những hệ thống biều tượng sẽ chẳng bao giờ
có thể mô phỏng được những tiến trình tư duy con người, nhất là tri thức
(perception), học hỏi và phân định biều mẫu (pattern recognition). Một số nhà nghiên cứu bắt đầu quan tâm đến
những phương án biểu tượng thứ cấp (sub-symbolic approaches) nhằm giải quyết
những vấn đề đặc thù của TKNT.
Tân TKNT – đi từ dưới lên, cụ thể, dựa trên hành vi
(Bottom-up, situated, behavior-based AI)
Những nhà nghiên cứu từ bộ môn liên quan của người máy bác bỏ TKNT biểu tượng (symbolic AI) và chú trọng đến những vấn đề kỹ thuật giúp người máy di chuyển và sinh tồn. Công trình của họ phục hồI quan điểm phi biểu tượng của các nhà nghiên cứu điều động học giai đoạn đầu những thập niên 50 và tái sữ dụng lý thuyết kiểm định (control theory) trong TKNT.
Computational Intelligence – CI (TKNT hạch toán) là một biến thể của TKNT tham chiếu những phương án phi
thực nghiệm (heuristic algorithms) như trong các hệ thống kiểm định siêu định
số (fuzzy control systems), hệ thống thần kinh nhân tạo (artificial neural
networks) và hạch toán tiến hóa (evolutionary computation) .
· Fuzzy control system là một hệ thống kiểm định dựa trên luận lý siêu định số (fuzzy logic), tức là một hệ thống toán học nhằm phân tích những giá trị định thể của nguồn vào (analog input values) theo những biến số luận lý (logical variables) mang những giá trị liên tiến giữa 0 và 1, trái hẳn với luận lý định số cổ truyền chĩ dựa trên các giá trị biên cực của 0 và 1 (false and true)
· Artificial neural networks là một mô hình toán học hay mô hình vi tính (mathematical model or computational model) dựa trên những hệ thống thần kinh sinh học. Hệ thống nầy gồm có một nhóm những giây thần kinh nhân tạo nối kết với nhau và xử lý các biến trình qua phương pháp liên kết (connectionist approach) để xử lý thông tin. Trong đa số các trường hợp, kỹ thuật nầy là một hệ thống thích ứng (adaptive system) biết thay đổi cấu trúc của nó dựa vào những thông tin nhập và xuất qua hệ thống trong quá trình tìm hiểu. Theo nghĩa thực tế hơn, hệ thống thần kinh nhân tạo là những phương tiện để tạo mô hình cho các dữ kiện thống kê siêu bật nhất (non-linear statistic modeling tools). Chúng có thể dùng để thiết lập mô hình cho những liên hệ phức tạp giữa nguồn vào và nguồn ra và tìm ra những biểu mẫu cho dữ kiện.
· Evolutionary computation (Hạch toán tiến hóa) là một chi hệ của TKNT, hay đúng hơn của TKNT Hạch Toán (Computational Intelligence) sữ dụng phương án tối ưu hóa giải pháp (combinatory optimization). Combinatory optimization là một ngành của lập trình toán học (mathematical programming) nhằm tìm cách tối đa hóa (maximize) một hàm số thực (real function) bằng cách lựa chọn một cách hệ thống những giá trị của những biến số mang số thực hay số nguyên (real or integer variables) từ một tập hợp của những giải pháp độc vị khả thi (discrete feasible solutions); và mục đích là tìm ra giải pháp tốt nhất có thể tìm được (best possible solution).
Hệ thống hóa (Formalization)
Trong những năm thập niên 90, các nhà nghiên cứu triển khai những trang cụ toán học tinh xảo để giải quyết những vấn đề phụ chuyên biệt (specific sub-problems). Những trang cụ nầy thực sự khoa học, theo nghĩa là những kết quả của chúng vừa đo lường được vừa kiểm chứng được, và nhờ đó mà có được những thành công mới đây trong khoa TKNT. Ngôn ngữ toán học thống nhất cũng đã tạo điều kiện hợp tác rộng rải giữa nhiều bộ môn như toán học, kinh tế, hay nghiên cứu hoạt động (operations research). Russel và Norvig mô tả trào lưu nầy là một cuộc cách mạng và chiến thắng của hệ thống hóa (neats*).
* Neats vs. Scruffies (Hệ thống hóa trái với cụ thể hóa). Trong TKNT, những từ ‘neats’ và ‘scruffies’ được dùng để tham chiếu một trong những tranh luận triết học đang tiêp tục diển ra trong công trình nghiên cứu TKNT. Cuộc tranh cải nầy tập trung vào một ưu tư nghiêm trọng: Đâu là phương án tốt nhất để thiết kế một hệ thống tinh khôn? ‘Neats’ có nghĩa là những giải pháp phải bảnh bao (elegant), minh bạch (clear) và có thể chứng minh là đúng. ‘Scruffies’ nghĩa là trí khôn quá phức tạp không thể giải quyết với những hệ thống thuần nhất (homogeneious system) như hệ thống hóa đòi hỏi.
2.2.4 Mô hình tác nhân tinh khôn (intelligent agent
paradigm)
Mô hình tác nhân thông minh được chấp nhận rộng rải trong thập niên 1990. Tác nhân tinh khôn là một hệ thống biết tri thức môi trường và hành động để tối ưu hóa những cơ may thành công. Những tác nhân tinh khôn đơn sơ nhất là những lập trình giải quyết các vấn đề đặc thù. Những tác nhân tinh khôn phức tạp nhất là con người biết tư duy và lý đoán. Mô hình nầy cho phép các nhà nghiên cứu giải quyết những vấn đề biệt lập và tìm ra những giải pháp hữu ích có thể kiểm chứng được, không cần phải nhất trí trên một phương án nhất định nào. Một tác nhân tinh khôn thiết kế cho một vấn đề đặc thù có thể dùng bất kỳ phương án nào xét thấy có hiệu quả - như biểu tượng và luận lý, hệ thống thần kinh biểu tượng thứ yếu và những phương án mới nào khác. Mô hình nầy cũng cung ứng cho các nhà nghiên cứu một ngôn ngữ chung để truyền thông với các bộ môn khác – như thuyết quyết định (decision theory) và kinh tế học - những bộ môn nầy cũng sữ dụng những khái niệm của tác nhân trừu tượng.
2.2.5 Tổng hợp các phương pháp (integrating the
approaches)
Một cấu trúc tác nhân hay cấu trúc tri thức cho phép các nhà nghiên cứu xây dựng những hệ thống linh động và thông minh hơn bằng cách cho đối tác những tác nhân tinh khôn trong một hệ thống gồm nhiều tác nhân như thế. Một hệ thống bao gồm những đơn vị vừa biểu tượng vừa thứ biểu tượng được gọi là một hệ thống tinh khôn hổn hợp (hybrid intelligent system) và công trình nghiên cứu những hệ thống như thế là một tổng hợp những những hệ thống TKNT. Một hệ thống kiểm định theo đẳng cấp cung ứng một cầu nốI giữa TKNT thứ biểu tượng ở trình độ thấp nhất, những trình độ phản ứng (reactive levels) và TKNT biểu tượng cổ truyền ở trình độ cao nhất, nơi những ức chế thời gian được nới lỏng cho phép xây dựng kế hoạch và mô hình hóa thế giới.
2.3
Phương tiện
Nghiên Cứu TKNT (Tools of AI Research)
Suốt 50 năm nghiên cứu, TKNT đả phát triển được rất nhiều
công cụ để giải quyết những vấn đề khó khăn nhất của Khoa học điện toán. Một ít những công cụ tổng quát nhất sẽ được
trrình bày dưới đây.
2.3.1
Nghiên cứu và tối ưu
hóa (Search and optimization)
Trên lý thuyết, nhiều vấn đề có thể được giải quyết bẳng
cách khôn khéo tìm tòi nhiều giải pháp khả thể như: Lý luận (reasoning) có thể được giản lược
thành tìm tòi. Ví dụ, chứng minh luận lý
có thể được xem như tìm tòi một liên hệ giữa tiền đề và kết luận, trong đó mỗi
bước là một áp dụng của suy suận pháp.
Những phương án hoạch định đi tìm những hệ thống của những mục tiêu
chính và mục tiêu phụ, cố gắng tìm ra một con đường đi đến mục tiêu tối hậu,
một tiến trình được gọi là phân tích phương tiện và cứu cánh (means-ends
analysis). Phương án giúp người máy
chuyển động chân tay và thao tác vật thể sữ dụng việc tìm tòi trên địa bàn
(local searches) thuộc không gian thiết định sẳn (configuration space). Nhiều phương án sữ dụng tìm tòi dựa trên kỹ
thuật tối ưu hóa (optimization).
Phương pháp tìm tòi đơn giản rốc ráo (simple exhaustive
searches) hiếm khi có khả năng giúp giải quyết những vấn đề thực trong đới
sống: không gian tìm kiếm nhanh chóng
gia tăng càng lúc càng vô cùng lớn.
Phương pháp tìm tòi trên sẽ trở nên quá nhỏ hay chẳng bao giờ hoàn tất. Trong nhiều trường hợp, giải pháp là chiến
thuật đặc thù thực tế (heuristics) nhằm loại bỏ những lựa chọn không thực
tế. Giải pháp nầy cung ứng một ước đoán
tốt nhất liên quan đến phương hướng giải quyết vấn đề.
Một phương án tìm tòi hoàn toàn khác được đưa ra trong
những năm 1990, dựa trên lý thuyết toán học tối ưu hoá (optimization). Đối với nhiều vấn đề, có thể bắt đầu tìm bằng hình thức ước đoán và sau đó thu hẹp dần
ước đoán đến khi không còn có thể thu hẹp được nữa. Phương án nầy có thể ví như người mù leo dốc: chúng ta bắt đầu tại bất kỳ một điểm nào đó
và sau đó bằng cách bước đi hay nhảy chúng ta tiếp tục di chuyển lên bằng ước
đoán cho đến khi lên đến đỉnh.
Phương pháp hạch toán tiến hóa (Evolutionary computation)
sữ dụng một hình thức tìm tòi tối ưu hoá.
Thực vậy, phương nầy bắt đầu với
một nhóm vi thể (những ước đoán sơ khởi) và sau đó cho phép những vi thể nầy
biến đổi và tái tạo, chĩ tuyển lựa những vi thể nào có khả năng sinh tồn cao
nhất trong mỗi thế hệ.
2.3.2
Luận Lý
(Logic)
Luận lý được John McCarthy đưa vào TKNT qua dự thảo
“Advice Taker” năm 1958. Bước phát triển
quan trọng nhất là sự khám phá phương án phối nghịch và hợp luận trong diển
dịch pháp (resolution and unification algorithm*) năm 1963. Phương án nầy giản dị, hoàn chỉnh và hoàn
toàn hệ thống và có thể thực hiện được qua những máy điện toán định số. Tuy nhiên, vì áp dụng ấu trỉ nên đã nhanh
chóng đưa đến sự bùng nổ biên đại (combinatorial explosion) hay luân đáo pháp vô hạn (infinite
loop).
a và b là những vế của mệnh đề,
ai là phần bổ sung của bj, và
đường gạch ngang có nghĩa là “sẽ đưa đến”
Mệnh đề bên dưới là mệnh đề kết của hai mệnh đề nhập bên
trên tách bằng dấu phảy.
Khi hai mệnh đề có nhiều cặp vế thì chĩ xữ lý độc lập
từng cặp một. Tuy nhiên, chĩ cặp nào đưa
đến mệnh đề kết mới được loại ra: những cặp khác tiếp tục ở lại.
Ví dụ điển hình:
Nếu a hay b
mang giá trị thực (true) , và a là hư (false)
hay c là thực, thì hoặc b hay c phải thực.
Nếu a là thực,
thì muốn tiền đề sau đứng vững, c phải thực.
Nếu a là hư, thì muốn tiền đề thứ nhất đứng vững, b phải thực.
Vì vậy, không
cần biết a mang giá trị gì, nếu cả hai tiền đề đứng vững thì hoặc b hay c phải
thực.
2.3.3 Phương pháp sát xuất trong suy luận bất xác (Probabilistic
methods for uncertain reasoning)
Nhiều vấn đề
trong TKNT như suy luận hoạch định, học hỏi, tri thức và người máy đòi hỏi tác
nhân phải hành động dựa trên thông tin bất xác hay không hoàn hảo. Từ những năm 80 và 90, Judea Pearl và những
ngưòi khác chủ xướng những phương pháp rút ra từ lý thuyết sát xuất va kinh tế
học để thiết kế nhiều phương tiện đắc lực nhằm giải quyết những vấn đề nầy.
Phương án sát
xuất cũng có thể dùng để lọc lựa, tiên liệu, kiện toàn và tìm ra những giải
thích cho các nguồn dử kiện, giúp các hệ thống tri thức phân tích những tiến
trình qua thời gian.
Một khái niệm
chủ yếu trong kinh tế học là giá trị tiện ích (utility): đơn vị dùng đo lường
mức độ lợi ích của một vật đối với tác nhân.
Nhựng phương tiện toán học chính xác được triển khai để phân tích phương
thức mà tác nhân lựa chọn và hoạch định bằng cách sữ dụng lý thuyết quyết định,
phân tích quyết định, lý thuyết giá trị thông tin.
2.3.4 Phân loại và
phương pháp nghiên cứu thống kê (classifiers and statistical learning methods)
Những áp dụng
đơn giản nhất của TKNT có thể được chia thành hai dạng: phân loại (classifiers) – “nếu sáng chói là
kim cương” và kiểm định (controllers) –“ nếu sáng chói thì nhặt lên”. Tuy nhiên, dạng kiểm định cũng phân loại điều
kiện trước khi hành động, và vì thế phân loại
tạo thành phần trung ương của nhiều hệ thống TKNT.
Phân loại là
những chức năng sữ dụng mô hình để xác định đồng dạng gần nhất. Những chức năng nầy được biến cải qua ví dụ,
làm cho chúng rất được lưu tâm trong TKNT.
Những ví dụ nầy được biết như là những quan sat hay biểu mẫu. Qua học hỏi có hệ thống, mỗi biểu mẫu thuộc
về một lớp được xác định nào đó. Một lớp
có thể được xem như là một quyết định đã được thực hiện. Tất cả những quan sat tổng hợp trong lớp của
chúng được gọi là một tập hợp dử kiện (data set).
Khi một quan
sát mới được ghi nhận, quan sát đó được xép loại căn cứ trên kinh nghiệm đã
có. Một chức năng phân loại có thể được
huấn luyện bằn nhiều cách; có nhiều phương án thống kê và giúp cho máy học hỏi.
Có rất nhiều
dạng phân loại, mỗi dạng có một có những
ưu va nhược điểm riêng của chúng. Hiệu
năng phân loại tùy thuộc nhiều vào những đặc tính của của dử kiện được phân
loại. Không có phương thức phân loại nào
hiệu quả tối ưu cho mọi vấn đề đặc ra.
Nhiều cuộc thực nghiệm đả được thực hiện để so sánh hiệu năng phân loại
và tìm ra những đặc tính của dữ kiện nào giúp phân loại có hiệu quả cao. Xác định dạng phân loại nào thích ứng cho một
vấn đề đặc ra chẳng qua là một nghệ thuật đúng hơn là một khoa học.
Những phương
pháp phân loại được sữ dụng rộng rải nhất là hệ thống thần kinh nhân tạo
(neural network), phương pháp trọng tâm (kernel methods)… Hiệu năng củă những phương pháp nầy đã được
so sánh qua nhiều nhiệm vụ phân loại khác nhau. để tìm ra những đặc tính dữ
kiện quyết định hiệu năng phân loại.
2.3.5
Ngôn ngữ
chuyên đề (Specilized languages)
Các nhà nghiên cứu đã triển khai nhiều lập trình ngôn ngữ chuyên đề cho TKNT:
q IPL (Information
Processing Language) gồm những kỹ thuật giúp các lập trình giải quyết vấn đề
như liệt kê (list), liên kết (associations), lượt đồ (schemas), bố trí ký ức
năng động (dynamic memory allocation), đối tượng vi tính (data types), qui đáo
pháp (recursion), khôi phục liên kết (associative retrieval), hàm số phục vụ
như thông số (functions as arguments), và hợp tác đa vụ (co-operative
multitasking). IPL tiên phong đề ra khái
niệm xữ lý danh sách (list processing) mặc dù thực tế IPL chĩ là một lập trình
ngôn ngữ ở dạng máy móc.
q LISP (List Processing
Language). Sau Fortran, LISP là dạng
ngôn ngữ điện toán trình độ cao lâu đời nhất.
Cũng như Fortran, LISP đả thay đổi nhiều từ ngay thời gian đầu, và đã để
lại một số những biệt ngữ vi tính (dialects). Ngày nay, những biệt ngữ dùng cho
những mục tiêu tỏng quát và được biết rộng rải nhất là Common LISP và
Scheme. Linked lists (danh sách liên
kết) là một trong những cơ cấu dử kiện chính của LISP. Ban đầu LISP được sáng tạo như một phương án
nghi chép toán học thực dụng (pratical mathematic notation) cho các chương
trình điện toán. Sau đó nó nhanh chóng
trở thành một lập trình ngôn ngữ được ưa chuộng trong bộ môn TKNT.
q PROLOG
(Programming in Logic) là một ngôn ngữ điện toán luận lý thưòng được liên kết
với TKNT và ngữ học vi tính (computational linguistics). Prolog gồm có một chi hệ thuần túy luận lý,
được gọi là “Pure Prolog”, cũng như một số những đặc trưng siêu luận lý
(extralogical features). Xuất phát từ
luận lý thuần túy, và không giống như các ngôn ngữ khác, Prolog là dạng lập
trình chiến lược (declarative), nghĩa là chĩ diển tả luận lý của lập trình mà
không mô tả các công đoạn. Prolog cố
gằng giảm thiểu hay triệt tiêu những phản ứng phụ (side effects) bằng cách mô
tả những gì chương trình phải làm thay vì phải làm ra sao. Phương án nầy ngược với lập trình chiến thuật
(imperative programming) đòi hỏi mô tả chi tiết phương thức tiến hành. Lập trình chiến lược xem các chương trình
điện toán như những lý thuyết luận lý thuần túy.
q STRIPS là một dạng
ngôn ngữ nhằm diển tả những biểu mẫu của vấn đế hoạch định máy móc (automated
planning problem instances). Ngôn ngữ
nầy diển tả một trạng thái ban đầu, những trạng thái mục tiêu, và một tập hợp
những hành động phải thữc hiện. Mỗ hành
động đều được thiết định bỡi những tiền đề (preconditions) và hậu đề
(postconditions).
q PLANNER là một
dạng hổn hợp giữa những lập trình chiến lược và chiến thuật. Ngôn ngữ nầy cung ứng phương thức hành động
cho những mệnh đề luận lý thuần túy trong đó những chỉ đạo trừu tượng được diển
tả bằng suy diển qua biểu mẫu (pattern-directed inference).
2.4 Đánh giá TKNT
(Evaluating artificial intelligence)
Làm thế nào xác định được một tác nhân tinh khôn? Năm 1950, Alan Turing đề nghị một phương pháp tổng quát để trắc nghiệm sự thông minh của một tác nhân gọi là trắc nghiệm Turing (Turing Test). Phương pháp nầy cho phép hầu hết các vấn đề lớn của TKNT được trắc nghiệm. Tuy nhiên, trắc nghiệm đó là một thách thức rất khó và hiện nay tất cả mọI tác nhân được trắc nghiệm đều thất bại.
Bộ môn TKNT cũng được đánh giá trên những vấn đề đặc thù
như những vấn đề nhỏ trong hoá học, nhận diện chữ viết và kỹ thuật làm
games. Những trắc nghiệm như thế được
gọi là những trắc nghiệm chuyên đề.
Những vấn đề nhỏ hơn cho thấy những mục tiêu khả thể hơn và càng ngày
càng có nhiều kết quả tích cực.
Phân loại đánh giá của trắc nghiệm TKNT:
Optimal (khá hơn): Có thể tiến bộ hơn
Strong super-human:
vượt hơn hẳn mọi người
Super-human: vượt hơn hẵn đa số người
Sub-human: kém hơn
đa số người
Ví dụ: Những nhiệm
vụ hằng ngày mà con người thực hiện được xếp hạng sub-human; kết quả thi
đấu cờ checkers được xếp hạng optimal; thi đấu cờ vua được xếp hạng super-human
và gần như strong super-human.