TRÍ KHÔN NHÂN TẠO (ARITFICAIL INTELLIGENCE - AI)

Phần II

Đông Yên - Master, Computer Science

(Phỏng theo John McArthy và một số tài liệu Tin Học khác)

*** WARNING::  This article may be used, and only used, for educational and/or non-commercial purposes

 provided it is used as is, i.e.,  with proper citation and without modifications whatsoever.

 

Trí Khôn Nhân Tạo (Aritficial intelligence - Ai) là trí khôn của máy móc.  Từ ngữ nầy cũng dùng để đặt tên cho một bộ môn của Khoa Học Điện Toán.  Hầu hết các sách giáo khoa về Trí Khôn Nhân Tạo định nghĩa bộ môn nầy là “công trình nghiên cứu và thiết kế những tác nhân tinh khôn (study and design of intelligent agents)”.  Tác nhân thông minh là một hệ thống nhận định hiện trường và thực hiện những hành động nhằm tối ưu hóa cơ may thành công.  John McArthy, người sữ dụng từ ngữ nầy vào năm 1956, định nghĩa nó như là “khoa học và công nghệ sản xuất máy móc tinh khôn (science and engineering of making intelligent machines)”. 

 Bộ môn được thành lập dựa trên luận đề là một thuộc tính (property) của con người, tức sự thông minh – sapience trong Homo sapiens – có thể được mô tả chính xác đến mức độ máy móc có thể mô phỏng theo được.  Luận đề nầy gây ra những tranh cải triết hóc liên quan đến bản chất của tinh thần (mind) và giới hạn đối với niềm tự hào của khoa học.  Các đề tài tranh cải nầy đã từng được đề cập qua thần thoại, giả tưởng và triết học từ ngàn xưa.  Trí Khôn Nhân Tạo từng là đề tài của bao lạc quan tột đỉnh, từng kinh qua những nghịch biến điên đảo, và ngày nay đã trở nên một bộ phận thiết yếu trong công nghệ kỹ thuật, cung ứng một lực đẩy ngàn cân cho các vấn đề nan giải nhất trong Khoa Học Điện Toán. 

 

Công tác nghiên cứu Trí Khôn Nhân Tạo nặng về kỹ thuật và chuyên biệt hóa đến độ một số nhà phê bình phản đối việc xé nát bộ môn ra quá nhiều chi hệ như vậy.  Các chi hệ của khoa Trí Khôn Nhân Tạo được tổ chức chung quanh những vấn đề đặc thù, việc áp dụng những dụng cụ đặc thù, và chung quanh những dị biệt cố hữu về quan điểm Lý thuyết.  Các vấn đề trọng tâm của Trí Khôn Nhân Tạo bao gồm những đặc tính như lý luận (resoning), nhận thức (knowledge), thiết kế (planning), tìm hiểu (learning), truyền thông (communication), tri thức (perception) và khả năng di chuyển và điều động vật thể (move and manipulate objects).

 

Mục Lục

 

1.        Viễn tượng của TKNT (Trí Khôn Nhân Tạo) – Perspectives on AI

1.1.               TKNH trong thần thoại, giả tưởng và suy đoán

1.2.               Lịch sử nghiên cứu TKNT

1.3.               Triết lý của TKNT

2.        Nghiên cứu TKNT

                   2.1   Những vấn đề của TKNT

    2.1.1   Diển dịch, suy luận, và giải quyết vấn đề (Deduction, reasoning, and problem solving)

    2.1.2  Lập định tri thức (Knowledge representation)

    2.1.3  Hoạch định (Planning)

    2.1.4  Học hỏi (learning)

    2.1.5  Xữ lý ngôn ngữ tự nhiên (natural language processing)

    2.1.6  Di chuyển và điều động (motion and manipulation)

    2.1.7  Tri giác (Perception)

    2.1.8  Trí khôn xã hội (social intelligence)

    2.1.9  Sáng tạo (creativity)

    2.1.10  Trí Khôn Toàn Năng (General Intelligence)

 

           2.2   Phương pháp của khoa TKNT (Approches to AI )

                     2.2.1    Điều Động Học và nảo bộ nhân tạo (Cybernetics and brain simulation)

                     2.2.2    TKNT biểu tượng cổ điển (Traditional symbolic AI)

2.2.3           TKNT biểu tượng thứ cấp (Sub-symbolic AI)

2.2.4           Mô hình tác nhân tinh khôn (Intelligent agent paradigm)

2.2.5           Tổng hợp các phương pháp (Integrating the approaches)

 

2.3            Phương tiện nghiên cứu TKNT (Tools of AI research)

2.3.1           Nghiên cứu và tối ưu hóa (Research and optimization)

2.3.2           Luận lý (Logic)

2.3.3           Phương pháp sát xuất trong suy luận bất xác (Probabilistic methods for uncertain reasoning)

2.3.4           Phân loại và phương pháp nghiên cứu thống kê (classifiers and statistical learning methods)

2.3.5           Ngôn ngữ chuyên đề (Specilized languages)

 

2.4              Đánh giá TKNT (Evaluating artificial intelligence)

 

 

 

2.2     Phương pháp của khoa TKNT (Approches to Ai )

Bộ môn TKNT không có một Lý thuyết hay mô hình chỉ đạo thống nhất khách quan.  Các nhà nghiên cứu không đồng ý với nhau trên nhiểu vấn đề.  Sau đây là một số những câu hỏi dai dẳng nhất chưa được trả lời:  Trí thông minh có thể được mô phỏng dựa trên những ký hiệu trừu tượng cao cấp như lời nói và tư tưởng hay không(words and ideas)?  Hay đòi hỏi phải có  biến trình ký hiệu thứ cấp (sub-symbolic processing)?  Trí khôn nhân tạo nên mô phỏng trí khôn thiên tạo bằng cách nghiên cứu tâm lý con người hay thần   kinh động vật học (human psycology or animal neurobiology)? Có đúng là giữa Sinh học về con người  và khoa TKNT không có liên quan gì cũng như tương quan giữa sinh học về chim và khoa học không gian?  Hành vi tinh khôn có thể được mô tả bằng cách sữ dụng những nguyên tắc đơn giản, lịch sự như luận lý học hay hạch toán tối ưu (logic or optimization)?  Hay TKNT nhất thiết phải cần giải quyết nhiều vấn đề ngoại vi không liên quan?

 

2.2.1        Điều Động Học và nảo bộ nhân tạo (Cybernetics and brain simulation)

 

Trong những thập niên 40 và 50, một số nhà khảo cứu đã tìm hiểu mối tương quan giữa Thần kinh Học (Neurology*), Lý  thuyết Thông Tin (information Theory**),  và Điều Động Học (Cybernetics***).

 

 Neurology (Thần Kinh Học) là một ngành chuyên môn của y khoa chuyên trị những rối loạn của hệ thống thần kinh,  Nói rõ hơn, ngành nầy chẩn đóan và chửa trị tất cả những loại bệnh liên quan đến những hệ thống thần kinh tự phát, trung ương và phụ cận (central, peripheral, and autonomic nervous systems), bao gồm những phần bao bọc, mạch máu, và toàn bộ cơ phận tác động (effector tissue) như cơ bắp.

 

 Information Theory (Lý thuyết Thông Tin) là một ngành của toán học ứng dụng  và công nghệ điện nhằm nghiên cứu nội dung thông tin. Theo lịch sử, Lý thuyết nầy được phát triển để tìm ra những giới hạn cơ bản khi nén dữ kiện và truyền tải dữ kiện đi một cách chính xác.  Từ khi mới thành lập, ngành nầy đã mở rộng để đưa các ứng dụng vào nhiều lảnh vực khác như luận suy thống kê (statistical inference), xử lý ngôn ngữ tự nhiên, mật mã, những hệ thống phi truyền tin, tiến hóa và chức năng của mã số phân tữ (molecular codes), lựa chọn biểu mẫu trong sinh thái học, vật lý nhiệt học (thermal physics), vật lý lượng tữ (quantum), thám sát đạo văn (plagierism detection), và các hình thức phân tích dữ kiện khác. 

 

Những khái niệm chính của Lý thuyết Thông Tin có thể hình dung được qua xem xét phương tiện truyền thông phổ cập nhất của con nguời:  ngôn ngữ.  Hai mặt chủ yếu của một ngôn ngữ tiêu chuẩn gồm có như sau:  Thứ nhất, những từ thông thường nhất (như, trong tiếng Anh chẳng hạn, “a”, “the”, “I”) phải ngắn hơn những từ ít thông thường hơn (như “benefit”, “generation”,”mediocre”); như thế các câu sẽ không qúa dài.  Một đánh đổi như thế về chiều dài của từ ngữ tương ứng với kỹ thuật thu nén dữ kiện (data compression*) và là yếu tố chủ yếu của kỹ thuật đó, đồng nghĩa với từ “source coding (thiết lập mã ngữ)”.   Thứ hai, nếu phần nào đó của câu không nghe được hay nghe không rõ vì nhiểu sóng thì bên nghe vẫn có thể nối kết được nghĩa của thông điệp bên dưới.  Để giải qưyết trường hợp nầy Lý thuyết Thông Tin sữ dụng một đơn vị đo lường gọi là entropy**.  Kiện năng (robustness) đó đóng vai trò chủ yếu trong  một hệ thống truyền thông cũng như trong một ngôn ngữ.  Thực hiện một kiện năng như thế trong truyền thông là nhiệm vụ của kỹ thuật mã hóa trên kênh (Channel coding***), một trong hai thành tố chủ lực của Lý thuyết Thông Tin.  Cũng cần lưu ý là những kỹ thuật nầy không liên quan đến tầm quan trọng của thông điệp được gởi.  Nói hay viết một câu xã giao thông thường như “Xin cám ơn;  mong được gặp lại” hay yêu cầu cấp cứu như “Hãy gọi xe cứu thương” cũng chiếm một chổ chứa gần như nhau.  Nói cách khác, Lý thuyết Thông Tin chĩ quan tâm đến lượng (quantity) chứ không phải phẩm (quality) của thông điệp.

 

Cybernetics (Điều Động Học) là công trình nghiên cứu liên bộ môn (interdisciplanary study) về cấu trúc của những hệ thống điều hành (regulatory systems).  Từ nầy bắt nguồn từ tiếng Hi lạp và có nghĩa là “nghệ thuật lều lái (art of streering)”.  Điều động học có nhiệm vụ xác định mục tiêu và hành động để đạt mục tiêu đó. Muốn biết mục tiêu đạt được hay không cần phải có thông tin phản ảnh (feedback), một khái niệm của Điều Động Học.  Điều Động Học liên kết kiểm định (control) -  tức hành động được thực hiện để đạt mục tiêu - với truyền thông (communication) - tức là nối kết và trao đổi thông tin giữa tác nhân và môi trường.  Điều Động Học cũng áp dụng cho những hệ thống vật lý và khoa học xã hội.  Điều Động Học thích hợp nhất khi hệ thống khao sát được thiết kế trong vòng tín hiệu đóng kín (closed signal loop) trong đó tác động của hệ thống trên môi trường tạo ra thay đổi trên môi trường đó và sự thay đổi nầy thể hiện trên hệ thống qua thông tin hay phản ảnh và những thông tin hay phản ảnh nầy lại tạo ra những thay đổi theo hướng hoạt động hiện hành của hệ thống, tất cả chĩ để phục vụ một hay nhiều mục tiêu.  Mối tương quan nhân quả vòng tròn nầy (circular causal relationship) là điều kiện cần và đủ cho một viễn tượng Điều Động Học.

 

Nảo bộ nhân tạo (Brain simulation):  Bộ óc có thể mô phỏng.  Hans Moravec, Ray Kursweil và những người khác cho rằng vế mặt kỹ thuật có thể sao chép bộ óc trực tiếp vào nhu liệu và thiết bị vi tính, và một mô phỏng như vậy cơ bản sẽ tương tự như bản gốc.  Thuyết nầy kết hợp thuyết cho rằng một máy với hiệu năng cao thích hợp có thể mô phỏng bất kỳ một tiến trình nào với thuyết duy vật cho rằng tinh thần chĩ là hệ quả cuả những tiến trình vật lý trong nảo bộ.

 

*  Data Compression or Source Coding là quá trình mã hoá thông tin bằng những kế sách đặc biệt (specific coding scheme) sữ dụng số lượng đơn âm điện tữ (bits) hay đơn vị vi tính nào khác ít hơn so với phương thức lập định thông tin không mã hóa.  Những ví dụ gồm có thể nén ZIP, RAR, GZIP, tất cả có nhiệm vụ chứa nhiều nguồn tài liệu trong cùng một địa chỉ.  Cũng như bất kỳ hình thức truyền thông nào, truyền tải dữ kiện chĩ hoạt động khi cả hai bên gởi và nhận đều hiểu được kế sách mã hóa. Kỹ thuật thu nén dữ kiện rất hữu ích vì nó giúp giảm thiểu việc sữ dụng tài nguyên vi tính cũng như thể tích đĩa hay dải tần truyền tải (hard disk space or transmission bandwidth). 

 

** Entropy là từ ngữ được dùng trong nhiều lảnh vực khác nhau, không chĩ trong Lý thuyết Thông Tin.  Sau đây là một số những định nghỉa chính:

(1)     Trong một hệ thống động nhiệt học (thermodynamic system) entropy là một đơn vị đo lường số lượng nhiệt năng không tham gia vào hoạt động của hệ thống.

(2)     Trơng một hệ thống biệt lập (closed system) entropy là đơn vị đo lường của sự rối loạn hay bất định của hệ thống (disorder or randomness)

(3)     Trong  xã hội học entropy ám chỉ sự suy thoái (deterioration) của một hệ thống hay xã hội

(4)     Trong khoa học vật lý, entropy là khuynh hướng giả định của tất cả vật thể và năng lượng tiến về tình trạng đồng dạng bất biến (inert uniformity)

(5)     Trong Lý thuyết Thông Tin entropy là một đơn vị đo lường độ bất xác (uncertainty) của một biến số ngẩu nhiên (random variable), thường được biểu diển bằng con số trung bình của những đơn âm điện tữ (bit) cần thiết để chứa hay truyền tải dữ kiện, biến thiên theo độ sát xuất mà dữ kiện bao gồm một tập hợp tín hiệu nào đó.  Nói một cách đơn giản thì entropoy là đơn vị dùng  đo lường  những thông tin bị mất trong thông điệp gởi đi (measure of the loss of information).  Theo trực quan, đơn vị thông tin (enthropy) định lượng hóa ước số bất xác (quantifies the uncertainty) khi gặp phải một biến số ngẩu nhiên (random variable).  Ví dụ, giá trị bất xác sấp hay ngửa của một đồng tiền bình thường chĩ giới hạn ở 2 ngẩu nhiên trong lúc ngầu nhiên đó là 6 đối với một hột xí ngầu.  Theo Claude E. Shannon, đơn vị đo lường nầy là một giới hạn tuyệt đối (absolute limit) của kỹ thuật thu nén dữ kiện tối ưu của truyền thông:  xem những thông điệp mã hóa như là một liên trình (sequence) những biến số ngẩu nhiên độc lập và phân phối đồng bộ (sequence of independent and identically-distributed random variables). 

       Công thức mà Shannon dùng để tính entropy của thông điệp M truyền tải bằng đơn âm (bits):

            
H(M) = -log2 p(M) //    p(M) là sát xuất của M

       

Đơn vị entropy H của một biến số nguyên tố ngẩu nhiên X (discrete random variable) là thước đo độ bất xác (uncertainty) của X.  Giả thử thông điệp truyền đi gồm 1000 đơn âm (bits).  Nếu những đơn âm nầy được biết trước khi truyền tải (tức có giá trị nhất định  0 hay 1 với sát xuất tuyệt đối – absolute probability) thì, theo luận lý, không có  thông tin nào được truyền đi cả.  Ngược lại, nếu mọi đơn âm (bit) đều có khả thể đồng đều bằng 0 hay 1  và độc lập với nhau, thì theo nghĩa luận lý, 1000 đơn âm được truyền tải.  giữa hai cực biên đó (0 và 1000), thông tin được định lượng như sau:  Nếu  \mathbb{X}\, là tập hợp những thông điệp x trong đó có X, và p(x) là sát xuất của X dựa theo x, thì entropy của X được định nghĩa như sau:

 

 H(X) = \mathbb{E}_{X} [I(x)] = -\sum_{x \in \mathbb{X}} p(x) \log p(x).

 

Entropy của X, tức H(X), được biểu diển bằng giá trị ước tính (expected value:  \mathbb{E}_{X}[I(x)]).  Một đặc tính quan trọng của entropy là nó mang giá trị lớn nhất (maximized) khi tất cả thành tố n  trong tập hợp đều có sát xuất đồng đều (Equiprobable): p(x) = 1/n, nghĩa là khó tiên liệu nhất; trong trường hợp nầy H(X) = logn.

 

***  Channel Coding (Mã hóa trên kênh) Trong công nghệ điện, khoa học điện toán, và Lý thuyết Thông Tin, thể tích kênh (channel capacity) là biên cực thượng lớn nhất (tightest upper bound) của lượng thông tin có thể truyền đi một cách đáng tin cậy qua kênh truyền thông. Theo định lý mã hóa kênh nhiểu (noisy-channel coding theorem), thể tích của một kênh là lưu lượng thông tin lớn nhất (đơn vị thông tin cho từng đơn vị thời gian ) có thể đạt được với sai suất nhỏ nhất (arbitrarily small error probability). Kết quả chính cho thấy thể tích kênh như được định nghĩa bên trên là thể tích thông tin hổ tương tối đa giữa nguồn vào và nguồn ra (maximum of the mutual information between the input and output of the channel).  Khả năng tối đa hóa có được là do sự phân phối của nguồn vào.  Channel coding chính thức được định nghĩa như sau:

Y

 

X

 
Text Box: Receiver
(Bên nhận)
Text Box: Transmitter
(Bên gởi)
Text Box: (Noisy) Channel
(Kênh nhiểu)
 

 

 


 

Giả sữ X là không gian của những tín hiệu gởi đi và Y, không gian của những tín hiệu nhận được trong một khung thời gian trên kênh.

Giả sữ    PX,Y(x|y) là hàm số phân phối có điều kiện (conditional distribution function) của Y đối với X.

Qua một số bước toán học thống kê, Shannon đi đến công thức sau cùng cho thể tích kênh (C - Channel capacity) như sau:

 

\ C = \sup_{p_X} I(X;Y)\,

 

 

2.2.1        TKNT biểu tượng cổ điển (Traditional symbolic AI)

 

Khi máy vi tính bắt đầu phổ cập vào giữa thập niên 1950, công tác nghiên cứu TKNT bắt đầu thăm dò khả năng giản lược trí không con người vào biến trình xữ lý  biểu tượng (symbol manipulation).  Công tác nghiên cứu tập trung tại ba Đại học: CMU, Stanford, and MIT; và mỗi đại học triển khai phương án nghiên cứu riêng của mình. 

 

Mô phỏng tri thức (cognitive simulation)

Kinh tế gia Herbert Simon và Alan Nowell nghiên cứu sở năng giải quyết vấn đề của con người và cố gắng hệ thống hóa chúng lại; và những công trình của họ đã đặt nền tảng cho bộ môn TKNT cũng như khoa học tri thức (cognitive science), nghiên cứu hoạt động (operation research*), và khoa học quản lý (management science).  Toán nghiên cứu của họ thực hiện những thí nghiệm tâm lý để chứng minh sự tương đồng giữa phương thức mà con người giải quyết  vấn đề và những lập trình điện toán mà họ đã triển khai (như “General Problem Solver”).  Truyền thống nầy, tập trung tại Đại học Carnegie Mellon University, về sau đóng vai trò chủ yếu trong việc phát triển cơ cấu SOAR*** vào giữa thập niên 80.

 

*  Operation research (Nghiên cứu hoạt động) là một ngành kết hợp giữa toán học ứng dụng và khoa học qui phạm (formal science) được phát triển tại Bắc Mỹ, Nam Phi, và Úc.  Ngành nầy sữ dụng những phương pháp như mô hình toán học, thống kê, va chương pháp (algorithm**) để đạt được những giải pháp tối ưu hay gần như thế cho những vấn đề phức tạp.  Vấn đề chủ yếu là làm sao đạt được trị số cực đại (maxima) – như lợi tức, hiệu năng hoạt động, thu hoạch, dải tần v.v. – hay giảm thiểu trị số cực tiểu (minima) – như lỗ lã, tai nạn .. - của một hàm số khách quan nào đó (objective function).  Bộ môn nầy giúp công tác quản lý đặt được mục tiêu  bằng cách sữ dụng những phương pháp khoa học.

 

**  Algorithm (Chương pháp). Trong toán học, vi tính, ngữ học và những đề tài liên hệ, Algorithm là một liên trình (sequence) những chỉ đạo, thường được dùng cho tính toán và xữ lý dữ kiện (data processing). Theo nghĩa khoa học mà nói thì đó là một phương pháp hiệu quả (effective method) trong đó, từ một tình trạng ban đầu nhất định nào đó, một liên trình những chỉ đạo được xác định rõ ràng sẽ tiến hành qua một liên trình những tình trạng tương ứng, và cuối cùng sẽ chấm dứt ở một tình trạng kết thúc (end-state) nào đó.  Sự chuyển tiếp từ tình trạng nầy sang tình trạng kế tiếp không nhất thiết có tính cách tất định (deterministic); một số chương pháp, được gọi là chương pháp sát xuất (probabilistic algorithms), bao gồm yếu tố ngẩu nhiên (randomness).  Phương pháp hiệu quả (effective method) cho một số vấn đề nhất định là một phương pháp trong đó mỗi bước có thể được xem như là một hoạt động cơ hành (mechanical operation) và nếu tuân theo nghiêm khắc và đến nơi đến chốn sẽ đưa đến những kết quả sau đây:

·         Luôn luôn cho ra một trả lời thay vì chẳng bao giờ có một trả lời nào cả;

·         Luôn luôn cho câu trả lời đúng và chẳng bao giờ cho câu trả lời sai;

·         Luôn luôn hoàn tất trong một số bước nhất định thay vì không tiên liệu được bao nhiêu bước;

·         Tập trung giải quyết những vấn đề nhất định đã đề ra.

 

*** SOAR (Symbolic cognitive architecture) vừa tượng trưng cho tiến trình tri thức (cognition) vùa minh họa tiến trình đó qua một cấu trúc lập trình vi tính dùng cho TKNT.  Mục tiêu chính của dự án nầy là nghiên cứu toàn bộ những khả năng của một tác nhân tinh khôn (intelligent agent), bao gồm cả những vấn đề bỏ ngỏ thông thường lẫn khó khăn quyết liệt nhất.  Muốn thế, theo quan điểm của cấu trúc nầy, cần phải có khả năng tạo dựng những biểu trình (representations) và sữ dụng những hình thái tri thức thích hợp, như tri thức vận hành (procedural), tri thức thuyết ngôn (declarative), tri thức tự thuật (episodic), và có thể cả tri thức yếu tính (iconic).  Cấu trúc nầy từ đó sẽ tìm hiểu một tập hợp nào đó những bộ máy của tinh thần.  Mặc dù mục tiêu cuối cùng của dự án nầy là đạt đến trí khôn toàn năng (general intelligence), chưa có một công bố nào cho biết mục tiêu nầy đã được thực hiện hay chưa.  Những nhà thiết kế thừa nhận cấu trúc hãy còn thiếu một số mặt quan trọng của trí thông minh.

 

TKNT Thuần lý (Logical AI)

 

Không giống như Newell và Simon, John McCarthy thấy rằng máy móc không cần mô phỏng tư duy con người, nhưng ngược lại nên tìm ra yếu tính của tư duy trừu tượng và phương thức gỉải quyết vấn đề, bất luận những phương thức con người sữ dụng có giống nhau hay không. 

 

TKNT Tượng Trưng Cụ Thể (scruffy symbolic AI)

 

Các nhà nghiên cứu tại Đại Học MIT thấy rằng giải quyết những vấn đề khó khăn bằng thị giác và ngôn ngữ tự nhiên (in vision and natural language) đòi hỏi phải có những giải pháp cá thể (ad-hoc solutions) - họ cho rằng không có một nguyên tắc đơn giản và phổ quát nào (như luận lý chẳng hạn) có thể áp dụng cho mọi khía cạnh của hành vi thông minh.  Phương án nầy được mô tả như là phi luận lý (anti-logic).

 

TKNT dựa vào trí thức dự trử (knowledge-based AI)

 

Khi máy vi tính đạt đuợc  những bộ nhớ lớn vào khoảng năm 1970, các nhà nghiên cứu từ mọi truyền thống bắt đầu lắp đặt kiến thức dự trử vào những ứng dụng TKNT.  Cuộc cách mạng kiến thức nầy đã dẩn đến việc triển khai những hệ thống chuyên viên (expert systems), hình thức nhu liệu thực sự thành công đầu tiên về TKNT.  Cuộc cách mạng kiến thức cũng bắt nguồn từ nhận định rằng ngay cả những ứng dụng TKNT đơn giản cũng sẽ đòi hỏi  những khối lượng kiến thức khổng lồ.

 

2.2.2        TKNT biểu tượng thứ cấp (Sub-symbolic AI)

 

Trong những thập niên 1960, những phương án biểu tượng (symbolic approaches) đã thành công lớn trong việc mô phỏng tư duy cao cấp bằng những lập trình biểu diển nhỏ.  Những phương án dựa trên điều động học (cybernetics) hay hệ thống thần kinh (neural networks) đã bị bỏ rơi và đẩy vào hậu trường.  Tuy nhiên, vào những thập niên 60, tiến bộ trong TKNT biểu tượng dường như dừng lại và nhiều người cho rằng những hệ thống biều tượng sẽ chẳng bao giờ có thể mô phỏng được những tiến trình tư duy con người, nhất là tri thức (perception), học hỏi và phân định biều mẫu (pattern recognition).  Một số nhà nghiên cứu bắt đầu quan tâm đến những phương án biểu tượng thứ cấp (sub-symbolic approaches) nhằm giải quyết những vấn đề đặc thù của TKNT.

 

Tân TKNT – đi từ dưới lên, cụ thể, dựa trên hành vi (Bottom-up, situated, behavior-based AI)

Những nhà nghiên cứu từ bộ môn liên quan của người máy bác bỏ TKNT biểu tượng (symbolic AI) và chú trọng đến những vấn đề kỹ thuật giúp người máy di chuyển và sinh tồn.  Công trình của họ phục hồI quan điểm phi biểu tượng của các nhà nghiên cứu điều động học giai đoạn đầu những thập niên 50 và tái sữ dụng lý thuyết kiểm định (control theory) trong TKNT.

 

Computational Intelligence – CI (TKNT hạch toán) là một biến thể của TKNT tham chiếu những phương án phi thực nghiệm (heuristic algorithms) như trong các hệ thống kiểm định siêu định số (fuzzy control systems), hệ thống thần kinh nhân tạo (artificial neural networks) và hạch toán tiến hóa (evolutionary computation) .

·         Fuzzy control system là một hệ thống kiểm định dựa trên luận lý siêu định số (fuzzy logic), tức là một hệ thống toán học nhằm phân tích những giá trị định thể của nguồn vào (analog input values) theo những biến số luận lý (logical variables) mang những giá trị liên tiến giữa 0 và 1, trái hẳn với luận lý định số cổ truyền chĩ dựa trên các giá trị biên cực của 0 và 1 (false and true)

·         Artificial neural networks là một mô hình toán học hay mô hình vi tính (mathematical model or computational model) dựa trên những hệ thống thần kinh sinh học.  Hệ thống nầy gồm có một nhóm những giây thần kinh nhân tạo nối kết với nhau và xử lý các biến trình qua phương pháp liên kết (connectionist approach) để xử lý thông tin.  Trong đa số các trường hợp, kỹ thuật nầy là một hệ thống thích ứng (adaptive system) biết thay đổi cấu trúc của nó dựa vào những thông tin nhập và xuất qua hệ thống trong quá trình tìm hiểu.  Theo nghĩa thực tế hơn, hệ thống thần kinh nhân tạo là những phương tiện để tạo mô hình cho các dữ kiện thống kê siêu bật nhất (non-linear statistic modeling tools).  Chúng có thể dùng để thiết lập mô hình cho những liên hệ phức tạp giữa nguồn vào và nguồn ra và tìm ra những biểu mẫu cho dữ kiện.

·         Evolutionary computation (Hạch toán tiến hóa) là một chi hệ của TKNT, hay đúng hơn của TKNT Hạch Toán (Computational Intelligence) sữ dụng phương án tối ưu hóa giải pháp (combinatory optimization).  Combinatory optimization là một ngành của lập trình toán học (mathematical programming) nhằm tìm cách  tối đa hóa (maximize) một hàm số thực (real function) bằng cách lựa chọn một cách hệ thống những giá trị của những biến số mang số thực hay số nguyên (real or integer variables) từ một tập hợp của những giải pháp độc vị khả thi (discrete feasible solutions); và mục đích là tìm ra giải pháp tốt nhất có thể tìm được (best possible solution).

 

Hệ thống hóa (Formalization)

 

Trong những năm thập niên 90, các nhà nghiên cứu triển khai những trang cụ toán học tinh xảo để giải quyết những vấn đề phụ chuyên biệt (specific sub-problems).  Những trang cụ nầy thực sự khoa học, theo nghĩa là những kết quả của chúng vừa đo lường được vừa kiểm chứng được, và nhờ đó mà có được những thành công mới đây trong khoa TKNT.  Ngôn ngữ toán học thống nhất cũng đã tạo điều kiện hợp tác rộng rải giữa nhiều bộ môn như toán học, kinh tế, hay nghiên cứu hoạt động (operations research).  Russel và Norvig mô tả trào lưu nầy là một cuộc cách mạng và chiến thắng của hệ thống hóa (neats*).

 

* Neats vs. Scruffies (Hệ thống hóa trái với cụ thể hóa).  Trong TKNT, những từ ‘neats’ và ‘scruffies’ được dùng để tham chiếu một trong những tranh luận triết học đang tiêp tục diển ra trong công trình nghiên cứu TKNT.  Cuộc tranh cải nầy tập trung vào một ưu tư nghiêm trọng: Đâu là phương án tốt nhất để thiết kế một hệ thống tinh khôn? ‘Neats’ có nghĩa là những giải pháp phải bảnh bao (elegant), minh bạch (clear) và có thể chứng minh là đúng. ‘Scruffies’ nghĩa là trí khôn quá phức tạp không thể giải quyết với những hệ thống thuần nhất (homogeneious system) như hệ thống hóa đòi hỏi.

 

2.2.4  Mô hình tác nhân tinh khôn (intelligent agent paradigm)

 

Mô hình tác nhân thông minh được chấp nhận rộng rải trong thập niên 1990.  Tác nhân tinh khôn là một hệ thống biết tri thức môi trường và hành động để tối ưu hóa những cơ may thành công.  Những tác nhân tinh khôn đơn sơ nhất là những lập trình giải quyết các vấn đề đặc thù.  Những tác nhân tinh khôn phức tạp nhất là con người biết tư duy và lý đoán.  Mô hình nầy cho phép các nhà nghiên cứu giải quyết những vấn đề biệt lập và tìm ra những giải pháp hữu ích có thể kiểm chứng được, không cần phải nhất trí trên một phương án nhất định nào.  Một tác nhân tinh khôn thiết kế cho một vấn đề đặc thù có thể dùng bất kỳ phương án nào xét thấy có hiệu quả - như biểu tượng và luận lý, hệ thống thần kinh biểu tượng thứ yếu và những phương án mới nào khác.  Mô hình nầy cũng cung ứng cho các nhà nghiên cứu một ngôn ngữ chung để truyền thông với các bộ môn khác – như thuyết quyết định (decision theory) và kinh tế học - những bộ môn nầy cũng sữ dụng những khái niệm của tác nhân trừu tượng.

 

2.2.5  Tổng hợp các phương pháp (integrating the approaches)

 

Một cấu trúc tác nhân hay cấu trúc tri thức cho phép các nhà nghiên cứu xây dựng những hệ thống linh động và thông minh hơn bằng cách cho đối tác những tác nhân tinh khôn trong một hệ thống gồm nhiều tác nhân như thế.  Một hệ thống bao gồm những đơn vị vừa biểu tượng vừa thứ biểu tượng được gọi là một hệ thống tinh khôn hổn hợp (hybrid intelligent system) và  công trình nghiên cứu những hệ thống như thế là một tổng hợp những những hệ thống TKNT.  Một hệ thống kiểm định theo đẳng cấp cung ứng một cầu nốI giữa TKNT thứ biểu tượng ở  trình độ thấp nhất, những trình độ phản ứng (reactive levels) và TKNT biểu tượng cổ truyền ở trình độ cao nhất, nơi những ức chế thời gian được nới lỏng cho phép xây dựng kế hoạch và mô hình hóa thế giới.

 

2.3     Phương tiện Nghiên Cứu TKNT (Tools of AI Research)

 

Suốt 50 năm nghiên cứu, TKNT đả phát triển được rất nhiều công cụ để giải quyết những vấn đề khó khăn nhất của Khoa học điện toán.  Một ít những công cụ tổng quát nhất sẽ được trrình bày dưới đây.

 

2.3.1        Nghiên cứu và tối ưu hóa (Search and optimization)

 

Trên lý thuyết, nhiều vấn đề có thể được giải quyết bẳng cách khôn khéo tìm tòi nhiều giải pháp khả thể như:  Lý luận (reasoning) có thể được giản lược thành tìm tòi.  Ví dụ, chứng minh luận lý có thể được xem như tìm tòi một liên hệ giữa tiền đề và kết luận, trong đó mỗi bước là một áp dụng của suy suận pháp.  Những phương án hoạch định đi tìm những hệ thống của những mục tiêu chính và mục tiêu phụ, cố gắng tìm ra một con đường đi đến mục tiêu tối hậu, một tiến trình được gọi là phân tích phương tiện và cứu cánh (means-ends analysis).  Phương án giúp người máy chuyển động chân tay và thao tác vật thể sữ dụng việc tìm tòi trên địa bàn (local searches) thuộc không gian thiết định sẳn (configuration space).  Nhiều phương án sữ dụng tìm tòi dựa trên kỹ thuật tối ưu hóa (optimization).

 

Phương pháp tìm tòi đơn giản rốc ráo (simple exhaustive searches) hiếm khi có khả năng giúp giải quyết những vấn đề thực trong đới sống:  không gian tìm kiếm nhanh chóng gia tăng càng lúc càng vô cùng lớn.  Phương pháp tìm tòi trên sẽ trở nên quá nhỏ hay chẳng bao giờ hoàn tất.  Trong nhiều trường hợp, giải pháp là chiến thuật đặc thù thực tế (heuristics) nhằm loại bỏ những lựa chọn không thực tế.  Giải pháp nầy cung ứng một ước đoán tốt nhất liên quan đến phương hướng giải quyết vấn đề.

 

Một phương án tìm tòi hoàn toàn khác được đưa ra trong những năm 1990, dựa trên lý thuyết toán học tối ưu hoá (optimization).  Đối với nhiều vấn đề, có thể bắt đầu tìm  bằng hình thức ước đoán và sau đó thu hẹp dần ước đoán đến khi không còn có thể thu hẹp được nữa.  Phương án nầy có thể ví  như người mù leo dốc:  chúng ta bắt đầu tại bất kỳ một điểm nào đó và sau đó bằng cách bước đi hay nhảy chúng ta tiếp tục di chuyển lên bằng ước đoán cho đến khi lên đến đỉnh.

 

Phương pháp hạch toán tiến hóa (Evolutionary computation) sữ dụng một hình thức tìm tòi tối ưu hoá.  Thực vậy, phương  nầy bắt đầu với một nhóm vi thể (những ước đoán sơ khởi) và sau đó cho phép những vi thể nầy biến đổi và tái tạo, chĩ tuyển lựa những vi thể nào có khả năng sinh tồn cao nhất trong mỗi thế hệ.

 

2.3.2        Luận Lý (Logic)

 

Luận lý được John McCarthy đưa vào TKNT qua dự thảo “Advice Taker” năm 1958.  Bước phát triển quan trọng nhất là sự khám phá phương án phối nghịch và hợp luận trong diển dịch pháp (resolution and unification algorithm*) năm 1963.  Phương án nầy giản dị, hoàn chỉnh và hoàn toàn hệ thống và có thể thực hiện được qua những máy điện toán định số.  Tuy nhiên, vì áp dụng ấu trỉ nên đã nhanh chóng đưa đến sự bùng nổ biên đại (combinatorial explosion)  hay luân đáo pháp vô hạn (infinite loop). 

 

            \frac{
a_1 \lor \ldots \vee a_i \vee \ldots \lor a_n, 
\quad b_1 \lor \ldots \vee b_j \vee \ldots \lor b_m}
{a_1 \lor \ldots \lor a_{i-1} \lor a_{i+1} \lor \ldots \lor a_n  \lor  b_1 \lor \ldots \lor b_{j-1} \lor b_{j+1} \lor \ldots \lor b_m}

 

a và b là những vế của mệnh đề,

ai là phần bổ sung của bj, và

đường gạch ngang có nghĩa là “sẽ đưa đến”

 

Mệnh đề bên dưới là mệnh đề kết của hai mệnh đề nhập bên trên tách bằng dấu phảy.

Khi hai mệnh đề có nhiều cặp vế thì chĩ xữ lý độc lập từng cặp một.  Tuy nhiên, chĩ cặp nào đưa đến mệnh đề kết mới được loại ra: những cặp khác tiếp tục ở lại. 

\frac{a \vee b, \quad \neg a \vee c}
{b \vee c}
Ví dụ điển hình:

                                                      

Nếu a hay b mang giá trị thực (true) , và a là hư (false)  hay c là thực, thì hoặc b hay c phải thực.

Nếu a là thực, thì muốn tiền đề sau đứng vững, c phải thực.  Nếu a là hư, thì muốn tiền đề thứ nhất đứng vững, b phải thực.

Vì vậy, không cần biết a mang giá trị gì, nếu cả hai tiền đề đứng vững thì hoặc b hay c phải thực.

 

2.3.3 Phương pháp sát xuất trong suy luận bất xác (Probabilistic methods for uncertain reasoning)

 

Nhiều vấn đề trong TKNT như suy luận hoạch định, học hỏi, tri thức và người máy đòi hỏi tác nhân phải hành động dựa trên thông tin bất xác hay không hoàn hảo.  Từ những năm 80 và 90, Judea Pearl và những ngưòi khác chủ xướng những phương pháp rút ra từ lý thuyết sát xuất va kinh tế học để thiết kế nhiều phương tiện đắc lực nhằm giải quyết những vấn đề nầy.

 

Phương án sát xuất cũng có thể dùng để lọc lựa, tiên liệu, kiện toàn và tìm ra những giải thích cho các nguồn dử kiện, giúp các hệ thống tri thức phân tích những tiến trình qua thời gian.

 

Một khái niệm chủ yếu trong kinh tế học là giá trị tiện ích (utility): đơn vị dùng đo lường mức độ lợi ích của một vật đối với tác nhân.  Nhựng phương tiện toán học chính xác được triển khai để phân tích phương thức mà tác nhân lựa chọn và hoạch định bằng cách sữ dụng lý thuyết quyết định, phân tích quyết định, lý thuyết giá trị thông tin.

 

2.3.4  Phân loại và phương pháp nghiên cứu thống kê (classifiers and statistical learning methods)

Những áp dụng đơn giản nhất của TKNT có thể được chia thành hai dạng:  phân loại (classifiers) – “nếu sáng chói là kim cương” và kiểm định (controllers) –“ nếu sáng chói thì nhặt lên”.  Tuy nhiên, dạng kiểm định cũng phân loại điều kiện trước khi hành động, và vì thế phân loại  tạo thành phần trung ương của nhiều hệ thống TKNT. 

 

Phân loại là những chức năng sữ dụng mô hình để xác định đồng dạng gần nhất.  Những chức năng nầy được biến cải qua ví dụ, làm cho chúng rất được lưu tâm trong TKNT.  Những ví dụ nầy được biết như là những quan sat hay biểu mẫu.  Qua học hỏi có hệ thống, mỗi biểu mẫu thuộc về một lớp được xác định nào đó.  Một lớp có thể được xem như là một quyết định đã được thực hiện.  Tất cả những quan sat tổng hợp trong lớp của chúng được gọi là một tập hợp dử kiện (data set).

 

Khi một quan sát mới được ghi nhận, quan sát đó được xép loại căn cứ trên kinh nghiệm đã có.  Một chức năng phân loại có thể được huấn luyện bằn nhiều cách; có nhiều phương án thống kê và giúp cho máy học hỏi.

 

Có rất nhiều dạng  phân loại, mỗi dạng có một có những ưu va nhược điểm riêng của chúng.  Hiệu năng phân loại tùy thuộc nhiều vào những đặc tính của của dử kiện được phân loại.  Không có phương thức phân loại nào hiệu quả tối ưu cho mọi vấn đề đặc ra.  Nhiều cuộc thực nghiệm đả được thực hiện để so sánh hiệu năng phân loại và tìm ra những đặc tính của dữ kiện nào giúp phân loại có hiệu quả cao.  Xác định dạng phân loại nào thích ứng cho một vấn đề đặc ra chẳng qua là một nghệ thuật đúng hơn là một khoa học.

 

Những phương pháp phân loại được sữ dụng rộng rải nhất là hệ thống thần kinh nhân tạo (neural network), phương pháp trọng tâm (kernel methods)…  Hiệu năng củă những phương pháp nầy đã được so sánh qua nhiều nhiệm vụ phân loại khác nhau. để tìm ra những đặc tính dữ kiện quyết định hiệu năng phân loại.

 

2.3.5        Ngôn ngữ chuyên đề (Specilized languages)

 

Các nhà nghiên cứu đã triển khai nhiều lập trình ngôn ngữ chuyên đề cho TKNT:

 

q  IPL (Information Processing Language) gồm những kỹ thuật giúp các lập trình giải quyết vấn đề như liệt kê (list), liên kết (associations), lượt đồ (schemas), bố trí ký ức năng động (dynamic memory allocation), đối tượng vi tính (data types), qui đáo pháp (recursion), khôi phục liên kết (associative retrieval), hàm số phục vụ như thông số (functions as arguments), và hợp tác đa vụ (co-operative multitasking).  IPL tiên phong đề ra khái niệm xữ lý danh sách (list processing) mặc dù thực tế IPL chĩ là một lập trình ngôn ngữ ở dạng máy móc.

 

q  LISP (List Processing Language).  Sau Fortran, LISP là dạng ngôn ngữ điện toán trình độ cao lâu đời nhất.  Cũng như Fortran, LISP đả thay đổi nhiều từ ngay thời gian đầu, và đã để lại một số những biệt ngữ vi tính (dialects). Ngày nay, những biệt ngữ dùng cho những mục tiêu tỏng quát và được biết rộng rải nhất là Common LISP và Scheme.  Linked lists (danh sách liên kết) là một trong những cơ cấu dử kiện chính của LISP.  Ban đầu LISP được sáng tạo như một phương án nghi chép toán học thực dụng (pratical mathematic notation) cho các chương trình điện toán.  Sau đó nó nhanh chóng trở thành một lập trình ngôn ngữ được ưa chuộng trong bộ môn TKNT.

 

q  PROLOG (Programming in Logic) là một ngôn ngữ điện toán luận lý thưòng được liên kết với TKNT và ngữ học vi tính (computational linguistics).  Prolog gồm có một chi hệ thuần túy luận lý, được gọi là “Pure Prolog”, cũng như một số những đặc trưng siêu luận lý (extralogical features).  Xuất phát từ luận lý thuần túy, và không giống như các ngôn ngữ khác, Prolog là dạng lập trình chiến lược (declarative), nghĩa là chĩ diển tả luận lý của lập trình mà không mô tả các công đoạn.  Prolog cố gằng giảm thiểu hay triệt tiêu những phản ứng phụ (side effects) bằng cách mô tả những gì chương trình phải làm thay vì phải làm ra sao.  Phương án nầy ngược với lập trình chiến thuật (imperative programming) đòi hỏi mô tả chi tiết phương thức tiến hành.  Lập trình chiến lược xem các chương trình điện toán như những lý thuyết luận lý thuần túy.

 

q  STRIPS là một dạng ngôn ngữ nhằm diển tả những biểu mẫu của vấn đế hoạch định máy móc (automated planning problem instances).  Ngôn ngữ nầy diển tả một trạng thái ban đầu, những trạng thái mục tiêu, và một tập hợp những hành động phải thữc hiện.  Mỗ hành động đều được thiết định bỡi những tiền đề (preconditions) và hậu đề (postconditions).

 

q  PLANNER là một dạng hổn hợp giữa những lập trình chiến lược và chiến thuật.  Ngôn ngữ nầy cung ứng phương thức hành động cho những mệnh đề luận lý thuần túy trong đó những chỉ đạo trừu tượng được diển tả bằng suy diển qua biểu mẫu (pattern-directed inference).

 

2.4  Đánh giá TKNT (Evaluating artificial intelligence)

 

Làm thế nào xác định được một tác nhân tinh khôn?  Năm 1950, Alan Turing đề nghị một phương pháp tổng quát để trắc nghiệm sự thông minh của một tác nhân gọi là trắc nghiệm Turing (Turing Test).  Phương pháp nầy cho phép hầu hết các vấn đề lớn của TKNT được trắc nghiệm.  Tuy nhiên, trắc nghiệm đó là một thách thức rất khó và hiện nay tất cả mọI tác nhân được trắc nghiệm đều thất bại.

 

Bộ môn TKNT cũng được đánh giá trên những vấn đề đặc thù như những vấn đề nhỏ trong hoá học, nhận diện chữ viết và kỹ thuật làm games.  Những trắc nghiệm như thế được gọi là những trắc nghiệm chuyên đề.  Những vấn đề nhỏ hơn cho thấy những mục tiêu khả thể hơn và càng ngày càng có nhiều kết quả tích cực.

 

Phân loại đánh giá của trắc nghiệm TKNT:

 

Optimal (khá hơn): Có thể tiến bộ hơn

Strong super-human:  vượt hơn hẳn mọi người

Super-human: vượt hơn hẵn đa số người

Sub-human:  kém hơn đa số người

 

Ví dụ:  Những nhiệm vụ hằng ngày mà con người thực hiện được xếp hạng sub-human; kết quả thi đấu cờ checkers được xếp hạng optimal; thi đấu cờ vua được xếp hạng super-human và gần như strong super-human.

 

 

Đông Yên