Tin Học Hán Nôm - Một Số Thành Tựu Và Triển Vọng

Discussion in 'Thông Báo Hán Nôm Học' started by admin, Jun 12, 2013.

  1. admin

    admin Thư Viện Sách Việt Staff Member Quản Trị Viên

    NGÔ THẾ LONG
    Viện Nghiên cứu Hán Nôm
    Với đầu đề trên, tôi muốn giới hạn vấn đề chỉ trong lĩnh vực ứng dụng Công nghệ thông tin vào việc nghiên cứu quản lí, bảo tồn, khai thác kho di sản văn hóa cổ của dân tộc, mà khối lượng khá lớn nằm tại Viện Hán Nôm và nếu làm được theo quyết định 311 của Chính phủ, thì phạm vi quản lí lại rộng khắp cả nước...
    Vì Công nghệ thông tin tiến triển rất nhanh, đã có hàng triệu loại sản phẩm phần cứng và phần mềm lưu hành....chỉ riêng việc đọc các tài liệu giới thiệu và chọn các phần đã khá vất vả,nhất là trong điều kiện chúng ta thiếu thốn mọi thứ....ở Trung Quốc có tạp chí Điện tử và Tin học mỗi ngày ra một số, gồm 6 trang khổ rộng, vòn Việt Nam có 2 tạp chí lớn nhất ra hàng tháng là PCWORLD - VN (Thế giới vi tính), và Tin học và đời sống.
    Với ý định trình bày ngắn gọn như trên, tôi xin đi theo dàn ý và các đề mục như sau:
    I- Định hướngnghiên cứu ban đầu và những kết quả đã dạt được (1992-1994)
    II- Năm 1995, bước ngoặt và thử thách.
    III- Công việc cầm làm từ năm 1996.
    I- ĐỊNH HƯỚNG BAN ĐẦU...
    Ý đố khi mở ra hướng nghiên cứu này, chúng tôi nghĩ cần phải đi dần từ thấp đến cao. tóm gọn như sau:
    1- Tạo bộ chữ Hán và Nôm đủ để tái hiện các văn bản cổ - mã hóa chúng trong máy tính (vì nếu không có bộ chữ Hán Nôm trong máy thì đừng nói gì đến Tin học hóa). Chữ Nôm không thể tách khỏi chữ Hán, vì trong bản chữ Nôm thường dùng đã có tới hơn 3000 chữ Hán.
    2- Xây dựng kho tư liệu chuyên ngành Hán Nôm, giúp cho việc quản lí khai thác di sản, tìm tòi tra cứu được thuận tiện, giải phóng con người bớt những việc nặng nhọc thủ công.
    3- Tiến lên nghiên cứu ứng dụng những xẻ lí cao cấp khác như nhận dạng và dịch máy. (Sở dĩ chúng tôi dám nêu vấn đề dịch máy, vì trên tạp chí PCWORLD từ năm 1993 đã đăng tin Trung Quốc và Thái Lan đã đạt được những thành công nhất định trong việc dịch máy tự động qua lại giữa tiếng Hán và tiếng Thái. Từ điển song ngữ phục vụ cho chương trình dịch được viết trên ngôn ngữ Foxbase)....
    Qua 2 năm thực hiện đề tài "Bước đầu ứng dụng Tin học để bảo tồn và khai thác di sản thư tịch cổ Việt Nam", chúng ta đã đạt được một số kết quả như sau:
    1- Tìm hiểu được cơ chế xẻ lí chữ Hán, chữ Nôm trên máy tính. Việc này chúng ta làm được trong điều kiện bị bưng bít thông tin và còn bị cấm vận các thiết bị công nghệ cao cấp.
    2- Tự tạo lấy được một số cữ Nôm trên máy tính, để sử dụng.
    3- Bước đầu xây dựng một cơ sở dữ liệu về văn bia và kho sách Hán Nôm tại Viện.
    4- Tham gia xây dựng bảng chữ chuẩn của khối các nước dùng chữ tượng hình, với tư cách thành viên chính thức (nước có chủ quyền và có quyền biểu quyết).
    Ba việc đầu chúng ta dùng lực lượng trong Viện, phối hợp với chuyên gia tin học trong nước mà làmđược, để phục vụ nhu cầu của Viện, và một số cơ quan bạn. Và cũng phải nói rằng chất lượng in ra chưa đẹp, sản phẩm mới chỉ dùng trong 1 môi trường DOS (chạy dưới hệ điều hành MS - DOS).
    Công việc thứ 4 có kết quả đầu tiên bằng thành công của cuộc họp Tổ chức quốc tế IRG - 2 tại Hà Nội từ 28/2/1994 đến 5/3/1994 công nhận đợt đầu hơn 2000 chữ Nôm của Việt Nam đáng được đưa vào bảng chuẩn quốc tế ISO. Đầu đuôi việc nàu là do: được sự giúp đỡ của các chuyên gia người Việt tại Mỹ (nhóm của Tiến sĩ Ngô Thanh Nhàn), chúng ta đã thấy rõ rằng muốn giải quyết vấn đề chữ Nôm, thì phải tham gia giải quyết vấn đề theo quan điểm hệ thống và tổng thể. Có như vậy mới đạt được điều căn bản, vừa tránh đi vòng, vừa bảo vệ được di sản văn hóa dân tộc trên bình diện quốc tế, và có điều kiện để trao đổi thông tin với cácnước khác trong khu vực. Vì vậy, chúng ta đã tham gia tích cực vào nhóm công tác làm mã chuẩn cho chữ tượng hình (IRG) của tổ chức chuẩn hóa quốc tế (ISO). Việc này có sự quan tâm hỗ trợ của các vị lãnh đạo cao cấp của Nhà nước, của các chuyên khoa học hàng đầu, và của các cơ quan quản lí khoa học của Việt Nam, cộng với sự nỗ lực của cán bộ ta, nên đạt được kết quả.
    Chung quy lại, thì đề tài "Bước đầu..." mới chỉ làm được đúng như tên gọi của nó là "bước khởii đầu" của sự nghiệp, và có tác dụng làm 1 luận cứ cho những quyết định của lãnh đạo về hướng phát triển Công nghệ Thông tin trong giai đoạn sắp tới.
    II- NĂM 1995 BƯỚC NGOẶT VÀ THỬ THÁCH
    Khó khăn thứ nhất là không có kinh phí trong kế hoạch nghiên cứu từ đầu. Mặc dầu vậy, lãnh đạo Viện cũng động viên cán bộ làm để hoàn thành những việc mình đang theo đuổi và có ý nghĩa. Những công việc đã làm là:
    1 - Xây dựng dự án: Từ thành công bước đầu nói trên, được sự khích lệ của lãnh đạo,chúng tôi cùng cácchuyên gia Tin học trong nước đã đi vào xây dựng bản dự án triển khai mở rộng ứng dụng dần những thành quả đã đạt được, với sự tính toán phác thảo như sau: trong khoảng 5 năm giải quyết xong việc mã hóa cácchữ viết cổ của Việt Nam, đưa vào sử dụng xâu dựng cơ sở dữ liệu chuyên ngành, áp dụng những công nghệ mới như CD - ROM, tham gia mạng InterNet (Mạng trao đổi thông tin quốc tế. Còn ở trong nước nếu ta nối được với mạng củ Thư viện Quốc gia thì ta có thể thông qua đó mà tham gia quản lí số sách cổ hiện có trên phạm vi cả nước; vì mạng Thư viện Quốc gia đã nối với thư viện của 53 tỉnh và thành phố rối...).Tổng chi phí dự án trong 5 năm khoảng 5 tỷ đồng Việt Nam. Dự án có chú ý đào tạo và đào tạo lại khoảng 50 cán bộ của Viện ta, phối hợp với khoảng 20 cộng tác viên bên ngoài, tiến lên xây dựng Viện thành một trung tâm nghiên cứu xử lí đa ngữ và lưu trữ thông tin - sử liệu có uy tín của khu vực, đạt tiêu chuẩn quốc tế.
    Trung tâm góp ý nhiều lần cho sửa đi sửa lại và trình lên Ban chỉ đạo chương trình Quốc gia về CNTT xem xét. Ban chỉ đạo đã đệ trình chính phủ. Theo quy chế, dự án còn cần phải được đưa ra thẩm địn và chi tiết hóa thêm, đồng thời còn phải cân nhắc về khả năng đáp ứng của ngân sách Nhà nước, vì đây là công ciệc bảo tồn di sản văn hóa của Việt Nam, quốc gia ta phải tự đảm đương... Nhưng có thể nói đó là một dự án có tính khả thi.
    Hiện nay, Lãnh đạo Trung tâm đã khẳng định lại sự ủng hộ và dự án đã được đệ trình lên Ủy Ban Kế hoạch Nhà nước, chờ thẩm định.
    Ngày 7 tháng 4 năm 1995, Thủ tướng Chính phủ đã kí quyết định số 211 Ttg, phê duyệt Chương trình quốc gia về Công nghệ Thông tin từ năm 1996 đến năm 2000, trong đó trang 17, khoản 5 ghi rõ:
    ...."Nhà nước đầu tư cho việc nghiên cứu và triển khai một số dự án quan trọng:....
    - Dự án ứng dụng CNTT trong việc bảo vệ bảo tồn các di sản vănhóa dân tộc với nội dung chủ yếu là dùng Công nghệ Thông tin để xây dựng các kho dữ liệu về các di sản văn hóa, như CHỮ NÔM VÀ CÁC VĂN BẢN HÁN - NÔM, các tư liệu dưới dạng đồ họa..., để các kho tư liệu đó được bảo tồn, tôn tạo bằng các phương pháp hiện đại, và quan trọng hơn nữa là được khao thác sử dụng một cách thuận tiện cho mục đích nghiên cứu và phổ biến văn hóa dân tộc".
    (Toàn van quyết định nhiều đoạn có tính hướng dẫn chỉ đạo về chuyên môn và tổ chức rất sâu, chứng tỏ các chuyên gia soạn thảo ra nó đã thấu hiểu được điều "tâm huyết" của chúng ta! và họ cũng đã thể hiện được sự quan tâm sâu sắc của Thủ tướng đối với sự nghiệp khoa học bảo tồn và phát triển văn hóa của ông bà tổ tiên). Điều này thể hiện sự hỗ trợ vô cùng quý giá của các chuyên gia Tin học đối với Viện ta.
    2- Cũng trên quan điểm hệ thống và tổn thể, chúng tôi tiến hành khảo sát thử nghiệm việc mã hóa, hòa nhập thêm một loại chữ viết trong máy là chữ
    Thái, vốn là một loại chữ cổ của một dân tộc trong đại gia đình các dân tộc Việt Nam (việc Viện ta xin sưu tầm sách Thái ở Sơn La đã được Trung tâm tán thành và Văn phòng Chính phủ đã cho phép, con tiến hành vào lúc nào là tùy Viện). Công việc mã hóa chữ Thái này cũng nằm trong phạm vihoạt động chuẩn bị triển khai dự án của Viện ta.
    3- Nhưng năm 1995 cũng là năm có nhiều biến cố thử thách trực tiếp đối với đề tài này. Xin cử ra vài điều:
    a- Thực sự là đề tài đã kết thúc, hết kinh phí hoạt động. Trong một năm qua, anh em chúng tôi làm việc bằng nguồn kinh phí riềm lực và nói đùng hơn là kinh phí" vay mượn": thuê giờmáy Scaner, thuê chuyên gia lập trình, thuê người vẽ chữ... cái gì cũng phải đáp ứng với thời hạn khẩn cấp.
    Tiếp đến kì họp tháng 8/1995 tại Seoul: Phía ta đã nhận được Fax mời, ta đã gửi tài liệu, và Fax trả lời là sẽ tới dự, nhưng vì đến ngày lên đường, không có tiền mua vé máy bay, mình cũng im luôn, làm cho người ta phải hỏi lại đôi ba lần (có lẽ họ tưởng đại biểu Việt Nam bị lạc chăng?).
    Sau phiên họp Seuol, Ban biên tập của Tổ chức quốc tế IRG đã gửi quyết nghị không đưa chữ Nôm của Việt Nam vào bảng mã chuẩn như dự định. Cột "V" (chữ Nôm của Việt Nam) trong bản dự thảo đành để trống, trong khi đó hội nghị lại nhất trí mở thêm cột "S" cho nước thành viên mới là Singapor....
    Nguy cơ chữ Nôm bị gạt ra khỏi bảng mã chuẩn Quốc tế đã trở thành hiện thực!Sự việc này bắt buộc chúng tôi phải có một kiến nghị đặc biệt đó là đê nghị Tổng cục tiêu chuẩn Việt Nam phản đối ngay nghị quyết đó của Tổ chức quốc tế IRG (vì nếu không ai có ý kiến gì khác thì cuối tháng 9 họ sẽ thực hiện khóa sổ ngay)...Cuối cùng, Chủ tịch IRG cũng đã phải xem xét lại để giải quyêtư những khúc mắc về chữ Nôm.
    b- Năm 1995 có những sự kiện "từ xa" ảnh hưởng tới đề tài này:
    - Thứ nhất: năm 1995 là năm bắt đâu thực thi quyết định của Thủ tướng về chương trình CNTT. Có sự thay đổi về các đầu mối tiếp nhận, thẩm định và phê duyệt các dự án, như ta đã biết. Ban chỉ đạo Chương trình Quốc gia về CNTT không trực tiếp quản lí việc này, chỉ hướng dẫn điều phối về chuyên môn, cón kinh phí của các nhành kinh tế, văn hóa lấy từ cácnguồn đầu tư khác nhau. Dự án của Viện ta là dự án do Ngân sách Nhà nước đầu tư.
    Ngành CNTT gắn liền với cạnh tranh kinh tế, cạnh tranh thị trường. Năm 1995 các hãng, các tập đoàn lớn xuyên quốc gia, sau khi cấm vận được giải tỏa, đã vào làm ăn tại nước ta. Họ chú trọng đầu tư cho các dự án quan trọng mang lại lợi ích kinh tws trước hết, như dự án về bưu chính viễn thông, về hàng không, về tài chính, về thuế, ngân hàng, về dầu khí, hải quan, về thông tin thương mại, về hành chính, về giáo dục...Có dự án thuộc loại ODA, tổng giá trị vài triệu USD. Qua đó tôi càng thấy rõ những dự án về kinh tế và có thu hồi thì quan trọng hơn dự án về văn hóa, khoa học (nhất là trong thời buổi kinh tế thị trường này thì điều đó càng rõ).
    - Thứ hai: Ban chỉ đạo chương trình Quốc gia về CNTT đã tổ chức tuần lễ Tin học lần 4 tại Hà Nội với ý đồ mở cửa tiếp thu những bài học kinh nghiệm về phát triển CNTT của cácnước đi trước và đặc biệt của các nước láng giềng. Bạn bè rất chân thành ở gần và ở xa tới, đem đến cho ta những thông tin mới và những bài học rất quý giá. Tại đây, với những con số thống kê đầy sức thuyết phục, chúng tôi thấy rằng con thuyền CNTT Việt Nam đang đứng trước thử thách. Nếu có cách đi đúng đắn thi tiến kịp người, nếu không thì tụt hậu, phụ thuộc, bị nô lệ về thông tin, và tổn thất nhiều mặt( thậm chí taihọa sắp giáng xuống đầu cũng không biết) vì thua kém thông tin.
    + Tình hình như vậy quả thật là phức tạp. Nhưng, theo kinh nghiệm như của Trung Quốc: trớc hết, họ định ra bộ chữ chuẩn là mã Quốc tiêu (tiêu chuẩn quốc gia), các hãng cứ theo đó mà làm, tùy tài mà cạnh tranh. Người trong nước dùng phần mềm của hãng nào cũng đọc lẫn tài liệu của nhau được, mặc dù con chữ của họ nhiều và phức tạp (trái lại, Việt Nam thì tuy số "chữ cái" có ịt, nhưng đến nay vẫn chưa giải quyết dứt điểm vấn đề thống nhất một bảng mã, một phông chữ, chẳng hãng nào chịu theo hãng nào. Cũng vì vậy, mà Ban chỉ đạo Chương trình quốc gia về CNTT của ta còn phải lo giải quyết vấn đề mã chuẩn cho chữ phổ thông đã, vì đó nên chúng tôi thấy lại càng cần coi trọng thơn nữa nhiệm vụ khẳng định cho được vị trí của chữ Nôm trong bảng mã chuẩn quốc tế hơn bất cứ việc gì khác.
    - Thứ ba: Trong tương quan chung, chữ Nôm chỉ là chữ loại B. Nếu đưa hết các chữ loại B vào thì thỏa mãn yêu cầu của Việt Nam và một số nước khác,nhưng trong bảng mã 16 bit sẽ phải hy sinh chữ viết của gần 50 ngôn ngữ khác. Nếu không thì VIệt Nam chỉ được chấp nhận hơn 100 chữ Nôm thuần Việt, số còn lại sẽ chỉ được chấp nhận thông qua một số thành tố (mảnh ghép). Như vậy là tập hợp hoàn chỉnh của chữ Nôm VIệt Nam chưa được công nhận, và về kĩ thuật thể hiện, ta phải tiến hành công việc một cách khó khăn phức tạp hợp một ssó nước khác...Để giải quyết trọn vẹn vấn đề này chúng to phải kiên trì làm việc sưu tầm, mã hóa, và phải chờ đợi sự ra đời của bảng mã chuẩn 32 bit của ISO...
    III- CÔNG VIỆC CẦN LÀM TỪ NĂM 1996
    Năm 1995 đầy thử tách vàbài học. Năm 1996, nếu dự án được duyệt thì là năm bắt đầu của dự án, tức là "triển khai và đuổi kịp những mục tiêu khiêm tốn mà mình dặt ra" là phục vụ nghiên cứu, sưu tầm bảo quản....Và, công việc cấp bách, cần coi trọng là giành sức để tham gia làm chữ Nôm cho tốt, vì đây vừa là vấn đề tổng thể, lâu dài, mục tiêu văn hóa và truyền thông mang tính quốc gia, dân tộc, mà Viện ta có khả năng đóng góp nhiều, vừa là vấn đề nghiệp vụ tường xuyên của Viện. (Không phải chỉ đơn giản làmua một bộ soạn thảo chữ phồn thể của Trung Quốc về dùng là xong). Việc tất yếu phải làm là phải tổ chức và đào tại đội ngũ cán bộ để làm, trang bị đủ công cụ để làm. Trong tình hình công nghệ của ta đi sau, yếu kém như thế này, muốn vươn lên, có sức canh tranh, mà tổ chức không khéo léo, ai cũng chỉ nghĩ đến cá nhân mình, nội bộ cạnh tranh lẫn nhau thì chắc chắn sẽ dẫn đến thất bại.
    Qua những trình bầy trên, chúng tôi muốn rằng về phía Viện ta, anh em hiểu cho tình hình thực tế như đã nói để cùng nhau phấn đầu tiến lên.
    Năm 1995 quả là một năm thử thách và vất vả. Những thành tích đạt được là gay go, thắng lợi là sát nút. Chúng ta ngôi trên con thuyền CNTT Việt Nam cũng đang trong cơn sóng gió, thử thách. Đó là một thực tế. Ta không thể toan tính môt điều gì thoát li khỏi thức tế đó được. Điều quan trọng là phải cùng nhau tìm ra bước đi thích hợp với điều kiện của mình. Trình độ kỹ thuật của ta rất yếu, kể cả nghiên cứu và soạn thảo. (Nếu có điều kiện, nên cử người sang hẳn Trung Quốc mà học nghiêm chỉnh, vì quan hệ trao đổi bây giờ đã khá hơn).
    Theo thiển ý của chúng tôi thì triển vọng đưa gần hết chữ Nôm vào bảng chuẩn Quốc tế là có thể được. Bây giờ ta đã có tư cách pháp nhân trong tổ chức quốc tế đó, không một nước nào có thể đơn phương tước bỏ vị trí của chữ Nôm, trừ phi ta tự rút lui và bỏ cuộc. Nhưng cũng phải kiên trì làm việc vài năm và phải làm nghiêm túc, kịp thời. Vấn đề xử lí kí tự tượng hình quả là một vấn đề "hóc búa" của Tin học. Các hãng hàng đầu thế giới đang lao vào giải quyết (vì thị trường của nó chiếm một phận ba dân số thế giới....) chưa thể coi là mọi việc đã xong xuôi. Công việc có ý nghĩa giao lưu quốc tế này phải được Trung tâm và Nhà nước hỗ trợ mới kham nổi.
    Vấn đề triển khai ứng dụng Tin học trong nội bộ rộng hay hẹp hoàntoàn do chủ trương và quan diểm đầu tư của các cấp lãnh đạo và chỉ đạo quyết định. Sự giúp đỡ của Ban chỉ đạo Chương trình Quốc gia về CNTT, của cấp trên và Thủ tướng đã rõ, vấn đề tiếp theo như thế nào là do Trung tâm có tạo điều kiện, và anh em ta lo tiếp thế nào cho mọi điều diễn ra tốt đẹp....
    Việc khẳng định quyền có mặt của chữ Nôm trong bảng mã chuẩn quốc tế để bảo tồn vĩnh viễn các di sản văn hóa của tổ tiên ta trong "Bộ nhớ lớn của nhân loại" và trong lòng con cháu ta là trách nhiệm, vinh dự và đóng góp của Viện ta. Từ đó dẫn tới quyền và trách nhiệm giải thích các chữ Nôm của người Việt Nam. Chữ Nôm gắn với văn hóa, với lợi ích, với danh dự dân tộc và danh dự của Viện, cho nên cần được các cấp lãnh đạo quan tâm hơn mữa. Đạt được một số kết quả là nhờ cố gắng rất lớn của toàn Viện và những người cộng tác nhiệt thành...
    Đó là mấy kinh nghiệm và thực trạng của Tin học Hán Nôm hiện nay.
    (Thông báo Hán Nôm học 1995, tr.165-176)

    https://www.mediafire.com/?hntqghhkmizgiq
     

Share This Page