Những công việc IT độc đáo nhất: "Giải mã sự sống", thám hiểm hệ mặt trời

LH  | 02/06/2012 0:00 AM

Hãy tưởng tượng, bạn là một chuyên viên I.T nhưng nhận nhiệm vụ phải mô phỏng hệ mặt trời? Lập bản đồ gene của loài người? Tư vấn cho các nhà vật lý học? Hay giải mã các kí tự cổ xưa? Những công việc đó đều rất thử thách và đặc biệt, tất cả được đề cập đến trong bài viết này.

Nhắc đến công việc hằng ngày của các chuyên viên I.T, chúng ta thường nghĩ đến những tác vụ như quản trị mạng, coding, thiết kế web, … Tuy nhiên, không chỉ có vậy, thế giới công nghệ thay đổi từng ngày, và những tiến bộ - thành tựu cũng như các đòi hỏi – yêu cầu trong khoa học cũng thổi những luồng gió mới vào công việc tưởng chừng khô khan này.
 
Hãy tưởng tượng, bạn là một chuyên viên I.T nhưng nhận nhiệm vụ phải mô phỏng hệ mặt trời? Lập bản đồ gene của loài người? Tư vấn cho các nhà vật lý học? Hay giải mã các kí tự cổ xưa? Những công việc đó đều rất thử thách và đặc biệt, tất cả được đề cập đến trong bài viết này.
 
Mô phỏng hệ mặt trời
 
Giao diện của Eyes On The Solar System.
 
Eyes On The Solar System là một ứng dụng web do NASA (Cơ quan Hàng không và Vũ trụ Mỹ ) phát triển, cho phép người dùng tìm hiểu về hệ mặt trời với các hình ảnh và chuyển động được mô phỏng 3D. Sau khi cài đặt Plugin theo yêu cầu của website, người dùng sẽ có 4 tùy chọn cơ bản trên cùng của trang gồm Home, Juno and The Science of Jupiter, The Juno SpacecraftMission với nhiều chuyên mục nhỏ như At Juno, At Earth, At Jupiter, At Moon. Trải nghiệm qua các tùy chọn và tính năng của ứng dụng web này, chúng ta sẽ được tiếp xúc với những kiến thức về hệ mặt trời nói chung, và đặc biệt là hành trình thám hiểm Sao Mộc của tàu vũ trụ Juno (được NASA phóng lên quỹ đạo vào tháng 8/2011).
 
Lượng dữ liệu khổng lồ mà Eyes On The Solar System thu thập được là kết quả nghiên cứu của hàng chục tàu vũ trụ khác nhau trong nhiều thập kỉ. Tuy nhiên, độ lớn của kho dữ liệu này cũng đặt ra thách thức không nhỏ đối với các chuyên viên I.T của dự án - chúng cần được nén lại, nhưng vẫn phải giữ vững mức độ chính xác gần như tuyệt đối. Để giải quyết vấn đề này, một định dạng nén đặc biệt được giới thiệu với tên gọi SPICE. Mỗi SPICE gồm nhiều tệp kernel, cung cấp thông tin chính xác về vị trí và phương hướng di chuyển của một con tàu vũ trụ tại một thời điểm xác định trong quá khứ. Các thông tin này, sau đó, được đồng bộ hóa với bản đồ hệ Mặt trời của NASA, tạo nên một không gian 4D hoàn chỉnh.
 
Thời gian và khoảng cách thực được thể hiện trong Eyes On The Solar System.
 
Để hiển thị không gian 4D trong trình duyệt web, nhóm nghiên cứu sử dụng engine Unity3D – một trong những engine game có khả năng thích hợp với hầu hết mọi nền tảng (chỉ trừ Linux). Theo khuyến cáo của nhóm, Eyes On The Solar System không đòi hỏi cấu hình phần cứng cao – ứng dụng này sẽ hoạt động ổn định với hầu hết các đời máy phổ thông hiện nay. Tuy nhiên, để đạt hiệu năng tốt nhất, người dùng nên sử dụng trình duyệt web Firefox. Kết quả cuối cùng của dự án là một hệ thống độc đáo cho phép người dùng trải nghiệm lại các sự kiện thiên văn trong lịch sử, ví dụ như chuyến viễn chinh của tàu Voyager qua Sao Mộc, với những hình ảnh đầy màu sắc của hệ mặt trời và các tàu không gian. Toàn bộ hệ thống hiện đang hoạt động ổn định và được liên tục cập nhật theo thời gian.
 
Vận hành và quản lý một lượng dữ liệu lớn với độ chính xác cao, phát triển và hoàn thiện các engine 3D đẹp mắt – đó là những công việc thầm lặng của các chuyên viên I.T tại NASA. Mục tiêu lớn nhất mà nhóm phát triển hướng tới khi thực hiện dự án này không chỉ là để hỗ trợ các nhà khoa học trong quá trình nghiên cứu, mà còn nhằm khơi dậy niềm yêu thích thiên văn của những người sử dụng mạng Internet thông thường. Một chuyên viên phát biểu: “Có thể không có nhiều người biết về công việc của chúng tôi, nhưng một khi những thành quả lao động đó có tác động tích cực đến nhận thức của cộng đồng, với chúng tôi, thế là đủ”.
 
Quý độc giả của Genk.vn có thể tham khảo Eyes On The Solar System tại địa chỉ http://solarsystem.nasa.gov/eyes/
 
I.T với bản đồ gene của loài người
 
Giải mã bộ gene của loài người là một quá trình rất phức tạp.
 
So với kích cỡ của hệ mặt trời như được nhắc đến ở phần trên, từng con người chúng ta thật nhỏ bé. Tuy nhiên, không vì thế mà những công trình nghiên cứu về cơ thể con người kém hoành tráng hơn so với các nghiên cứu về thiên văn. Mỗi tế bào cơ thể người chứa một nhân bên trong với 46 nhiễm sắc thể, mỗi nhiễm sắc thể chứa khoảng 30.000 đến 50.000 gene và các chuỗi mã hóa không xen kẽ - điều đó dẫn đến hàng tỉ tỉ những phép tổ hợp và những trình tự gene khác nhau.
 
Trong phần tiếp theo, chúng ta sẽ cùng đến với viện nghiên cứu Broad – dự án được phối hợp thực hiện bởi hai trong số các cơ sở đào tạo hàng đầu nước Mĩ, đại học Harvard và học viện công nghệ Massachusetts (MIT). Nhiệm vụ chính của viện nghiên cứu này là sử dụng các siêu máy tính để xây dựng và lưu trữ các tổ hợp trình tự gene trong cơ thể người, nhằm cung cấp nguồn số liệu cho nhiều dự án nghiên cứu quan trọng khác, ví dụ như bản đồ trình tự 1000 gene đầu tiên, hay giải mã gene của các tế bào ung thư.
 
Một nhà khoa học ở viện Broad đưa ra nhận định: “I.T phát triển như vũ bão, công nghệ sinh học cũng vậy; thậm chí, sự kết hợp giữa chúng sẽ có tốc độ tăng trưởng nhanh hơn cả từng yếu tố riêng biệt.” Thật vậy, vào năm 2006, tổng khối lượng lưu trữ của toàn hệ thống mới đạt 200 terabyte; nhưng đến thời điểm hiện tại, con số này đã cán mốc 10 petabyte (10 triệu gigabyte!) và vẫn đang tiếp tục tăng lên mỗi ngày. Việc vận hành khối dữ liệu khổng lồ này cần đến sự trợ giúp của các siêu máy tính – một trên nền tảng Linux với 2500 vi xử lý và khoảng 500 GB RAM được chuyên môn hóa cho tác vụ lắp ráp gene vào các bộ tổ hợp ngẫu nhiên tự động, và một với 6000 vi xử lý được sử dụng để phân tích dữ liệu thu được.
 
Trung tâm dữ liệu của viện nghiên cứu Broad.
 
Dù vậy, các thách thức phần cứng mới đang tiếp tục xuất hiện. Thứ nhất, số lượng lõi xử lý ngày càng tăng tất yếu đi kèm với đòi hỏi cao hơn về RAM và khả năng lưu trữ, do đó tạo nên gánh nặng về chi phí. Thứ hai, khối lượng dữ liệu cần xử lý ngày càng lớn khiến việc sắp xếp, lắp ráp các tổ hợp gene vào đúng vị trí để các cỗ máy hoạt động ổn định ngày càng khó khăn hơn. Để giải quyết những vấn đề nêu trên, nhóm nghiên cứu một mặt tiếp tục gia tăng sức mạnh xử lý của các siêu máy tính, mặt khác tiếp tục nỗ lực phát triển các thuật toán mới trong phân tích.
 
Dữ liệu về kết quả của quá trình xử lý trên nhằm hỗ trợ ba nhóm đối tượng chính. Nhóm thứ nhất tập trung phân tích hệ gene theo cách truyền thống và hầu như ít đưa ra được những kết quả mới. Nhóm thứ hai, bao gồm một số dự án mới như bản đồ Gene của tế bào ung thư, còn khá ngổn ngang và đòi hỏi những lượng dữ liệu rất lớn. Nhóm thứ ba chính là những sinh viên và nghiên cứu sinh đang thực hiện những dự án nhỏ nhưng lại có mong muốn sử dụng thông tin, số liệu ở độ chính xác cao.
 
Các đề tài của nhóm thứ ba tuy nhỏ về quy mô, nhưng mang lại rất nhiều ý nghĩa: “Có cảm giác như chúng tôi phát triển được một cỗ máy phục vụ được cho tất cả mọi người vậy”. Công việc quản lý các siêu máy tính tại viện nghiên cứu Broad cùng khối lượng dữ liệu khổng lồ, dù thầm lặng, song các chuyên viên I.T cho rằng: “Những dữ liệu chúng tôi thu thập được giờ đây có thể được áp dụng trong chữa trị những căn bệnh nan y như ung thư. Được là một phần trong thành tựu đó quả là một niềm vinh dự”.
 
I.T và nghiên cứu vật lý học
 
Lần này, chúng ta tiếp tục tìm hiểu về công việc I.T tại một số cơ sở nghiên cứu vật lý, trong đó có Caltech (Học viện công nghệ California). Công việc này có nhiều nét giống với công việc tại viện nghiên cứu Broad: Trước tiên, phân tích các tác động vật lý đòi hỏi những cỗ máy siêu hạng. Tại Caltech, có hàng loạt siêu máy tính với số lõi từ 500 cho đến 4000, hầu hết đều dựa trên nền tảng x86. Ngoài ra, các siêu máy tính này cũng cần có tốc độ kết nối nội bộ cao, hệ thống dự phòng rủi ro hoàn chỉnh và phân công nhiệm vụ hiệu quả.
 
Bản đồ động đất tại bang California do Caltech thực hiện.
 
Mỗi siêu máy tính thường đảm nhiệm những tác vụ khác nhau. Bộ phận nghiên cứu địa chất và khoa học Trái Đất sở hữu một trong những cỗ máy lớn nhất, được sử dụng trong việc mô phỏng cấu tạo địa chất và khí hậu. Một máy chủ khác mô phỏng diễn biến của các trận động đất theo thời gian thực, với khả năng phát video trực tuyến lên các phương tiện truyền thông trong chưa tới 1 giờ từ khi sự kiện xảy ra. Caltech thậm chí còn phát triển một website cho phép người dùng tạo ra những mẫu thiết kế công trình, sau đó đưa vào thử nghiệm trong trận động đất mô phỏng. Ngoài ra, một số siêu máy tính khác được sử dụng để mô phỏng các cấu trúc động lực học phân tử và khí động học.
 
Những công việc tại CERN đòi hỏi sự phối hợp giữa chuyên viên I.T và nhà khoa học.
 
Bên cạnh các yếu tố trên, kiểu công việc này mang đến những thách thức hoàn toàn khác mà các chuyên viên I.T phải vượt qua, đặc biệt là trong quá trình trợ giúp các nhà khoa học. Giám đốc của CERN (Tổ chức nghiên cứu nguyên tử Châu Âu), ông Wolfgang Von Rueden cho biết: “Hầu hết các nhà khoa học tại trung tâm đều thực hiện công việc trên máy tính xách tay của mình; do đó các kĩ thuật viên I.T phải có hiểu biết sâu về nhiều nền tảng, nhiều hệ điều hành và những cách tinh chỉnh khác nhau. Máy tính cá nhân của các nhà nghiên cứu có thể được sử dụng với những mục đích cá nhân, do đó không tránh khỏi nguy cơ về phần mềm chứa mã độc và virus.”
 
Để giải quyết vấn đề này, đội ngũ I.T của CERN phải nâng cấp mạng nội bộ để bổ sung thêm chức năng theo dõi và cô lập các máy con nếu phát hiện bất cứ truy cập nào đáng ngờ. Thêm vào đó, họ đã thành lập phòng nghiên cứu của riêng mình để thử nghiệm những phần mềm, công cụ mới, tìm ra các cách cấu hình ổn định và duy trì trạng thái đó, với mục tiêu nâng cao hiệu quả công việc và sự hợp tác giữa I.T với khoa học.
 
Khi được hỏi về điểm thú vị nhất trong công việc của mình tại CERN, một chuyên viên cho biết: “Bạn có thể làm mọi thứ - những việc từ nhỏ nhất đến lớn nhất. Bạn có thể xác định vấn đề, qua đó thiết kế các giải pháp và vận hành chúng. Bạn có thể thay đổi một phần nhỏ cũng như cả hệ thống. Thêm vào đó, bạn sẽ được làm việc với những người … thông minh nhất thế giới (Cười).”
 
I.T và giải mã các kí hiệu cổ
 
Ba công việc I.T đã được nhắc đến kể từ đầu bài viết đều liên quan đến việc hỗ trợ quá trình nghiên cứu khoa học, và công việc thứ 4 cũng không phải là ngoại lệ. Chúng ta cùng đến với Ryan Baumann, một nhà nghiên cứu tại Đại học Kentucky – ông đang phát triển các đoạn mã giúp điều chỉnh các đối tượng và hình ảnh trong không gian ba chiều, qua đó số hóa và xử lý các văn tự cổ.
 

 
Để thực hiện công việc của mình, Baumann cùng nhóm nghiên cứu sử dụng một máy ảnh 40 megapixel để chụp những bức ảnh về tài liệu trên 14 bước sóng khác nhau, bắt đầu từ tia cực tím bước sóng 365 nm cho đến tia hồng ngoại bước sóng 940 nm. Tiếp theo, nhóm nghiên cứu sẽ chụp thêm một bức ảnh bằng tia laser để có được thông tin về hình dạng ba chiều cụ thể của tài liệu, bao gồm cả nếp gấp, nếp nhăn hay độ cong của từng trang giấy. Thêm vào đó, Baumann cũng viết một phần mềm giúp tái tạo tất cả các thông tin thu được ở trên vào một hình ảnh đa phổ. Kết quả của toàn bộ quá trình trên sẽ trở thành tài liệu nghiên cứu cho các học giả khác.
 
Một trong những dự án mà Baumann đã tiến hành là việc khôi phục thành công một bản phúc âm có nguồn gốc từ thế kỉ thứ VIII tại nhà thờ Lichfield, vương quốc Anh. Đó có thể coi là bản dịch tiếng Anh đầu tiên của Kinh Thánh, do đó văn tự cổ này có giá trị văn hóa rất lớn. Một dự án khác liên quan đến một ngôi làng La Mã cổ bị chôn vùi dưới tro bụi núi lửa. Lần này, nhóm nghiên cứu sử dụng thiết bị quét hình ảnh chứa trong những hộp kín. Thật không may, những nỗ lực đó không giúp tìm ra bất kì văn tự cổ nào có thể đọc được; nhưng cả nhóm cũng đã tìm ra cách gấp giấy và sử dụng vật liệu của con người thời cổ đại.
 
Giao diện của Papyri.info.
 
Chưa thỏa mãn với những thành quả đã đạt được, Baumann khẳng định sẽ khiến cho các kết quả trở nên dễ hiểu và dễ tiếp cận hơn. Ông tiếp túc phát triển Papyri.info, địa chỉ web lưu trữ các tài liệu cổ cùng các thông tin chi tiết về lịch sử và các bản dịch của nó. Công việc mà Baumann đảm nhận đem tới nhiều thách thức, nhưng đó cũng chính là thứ thu hút ông: “Phần thú vị nhất của công việc là tìm ra những vấn đề nghiên cứu liên quan đến cả hai mặt: Một mặt, chúng tôi sẽ tìm kiếm những thứ mà các học giả nghiên cứu về văn tự cổ quan tâm đến; mặt khác, bằng phương pháp tiếp cận kĩ thuật số, chúng tôi sẽ giúp họ tìm ra câu trả lời. Mục tiêu trên tạo ra những thách thức lớn, nhưng đó cũng là động lực để thúc đẩy khoa học máy tính tiến lên phía trước.”
 
Kết luận
 
Trong thời đại công nghệ thông tin, các thành tựu khoa học kĩ thuật từ những ngành nghề khác, như đã được đề cập đến trong bài viết, cũng có sự đóng góp rất lớn của các chuyên viên I.T. Làm việc trong những điều kiện hết sức đặc biệt, họ là những anh hùng thầm lặng, không thể thiếu trong mỗi dự án. Trong tương lai, sự giao thoa giữa khoa học máy tính và các ngành khoa học khác sẽ trở thành tất yếu, và tầm quan trọng của các chuyên viên I.T chắc chắn sẽ còn được đề cao hơn nữa…
 
Tham khảo: arstechnica, nasa