Trong toán học, không gian mêtric là một tập hợp mà một khái niệm của khoảng cách (được gọi là mêtric) giữa các phần tử của tập hợp đã được định nghĩa.
Không gian mêtric gần gũi nhất với cách hiểu trực quan của con người là không gian Không gian Euclide 3 chiều. Khái niệm "mêtric" trong thực tế là sự tổng quát hóa của mêtric Euclide phát sinh từ 4 thuộc tính được biết đến lâu đời của khoảng cách Euclide.[1] Không gian metric Euclide định nghĩa khoảng cách giữa 2 điểm bằng chiều dài theo đoạn thẳng nối chúng với nhau. Một không gian mêtric khác trong hình học Elíp và hình học hyperbolic, có khoảng cách trên quả cầu được đo bằng góc của một mêtric, và mô hình hyperboloid của hình học hyperbolic được dùng bởi thuyết tương đối hẹp với một không gian mêtric vận tốc.
Sơ lược về không gian metric
Định nghĩa không gian metric
Cho E là một tập hợp khác rỗng. Một ánh xạ thỏa mãn:
d(x, y) ≥ 0, với mọi x,yE (tính phân biệt dương)
d(x, y) = 0 khi và chỉ khi x = y
d(x, y) = d(y, x), với mọi x,yE (tính đối xứng)
d(x, z) ≤ d(x, y) + d(y, z), với mọi x,y,zE (bất đẳng thức tam giác)
Khi đó d được gọi là khoảng cách hay một metric trên E và cặp (E,d) được gọi là một không gian mêtric. Không gian metric (E,d) thường được viết là E với d được hiểu ngầm khi không bị nhầm lẫn.[2]
Một số metric thông dụng trong không gian Rn
Cho ,
p 1/p , khi p=2, metric này gọi là metric Euclide.
gọi là metric rời rạc.
Với mọi .
Metric trên không gian hàm từ tập A bất kỳ vào không gian metric (X,d)
Xác định bởi .
Trong đó .
Metric trên không gian các hàm liên tục từ [a,b] vào R
Cho là không gian metric và và r>0, theo định nghĩa [3]:
là quả cầu mở tâm a, bán kính r trong không gian metric (X,d).
là quả cầu đóng tâm a, bán kính r trong không gian metric (X,d).
Xét các bổ đề sau:
Bổ đề
Cho (X,d) là không gian metric, nếu thì sẽ có tồn tại sao cho:
.
Chứng minh:
Đặt , cần chứng minh
Hay lấy bất kỳ, thì
Do đó
Ví dụ về tập mở theo các metric trong R2
Cho và các metric sau:
221/2
Khi đó các quả cầu mở tương ứng với các metric trên trong lần lượt là: như hình vẽ:
Topo sinh bởi metric
Định lý
Cho (X,d) là không gian metric, họ các quả cầu mở là cơ sở của topo trên X.[4]
Chứng minh:
Điều cần chứng minh là cơ sở
Với mỗi được chứa trong một tập của . Dễ thấy
Xét điều kiện thứ 2 cho một cơ sở được thỏa, cần chỉ ra rằng nếu và thì có tồn tại sao cho .
Lấy là hai tập trong , và giả sử . Khi đó theo bổ đề 1.2.1, tồn tại sao cho và . Đặt . Khi đó như yêu cầu.
Định nghĩa
Lấy (X,d) là không gian metric, topo sinh bởi cơ sở các quả cầu mở được gọi là topo sinh bởi metric (còn gọi là topo metric).
Định lý
Cho (X,d) là không gian metric, một tập là mở trong topo sinh bởi metric d nếu và chỉ nếu với mỗi tồn tại sao cho .
Khoảng cách từ 1 điểm đến 1 tập
Cho X,Y là hai không gian metric và , A là tập con trong X.
được gọi là khoảng cách từ điểm x đến tập A theo đó khi và chỉ khi có thể kiểm chứng là metric và nó liên tục.
Khoảng cách Hausdorff
Cho X,Y là hai không gian metric và , A và B lần lượt là các tập con trong X,Y.
được gọi là khoảng cách từ tập A đến tập B
Hay còn có thể viết rút gọn là:
Khoảng cách này cũng là một metric và được gọi là metric Hausdorff.
khi và chỉ khi
Không gian metric tích
Không gian metric tích là không gian tích của tất cả các không gian metric, cụ thể:
Cho là các không gian metric, định nghĩa là không gian metric tích.
Cho .
Đặt và thì
Ví dụ
Cho là các không gian metric, định nghĩa metric tích trên như sau:
.
Kiểm tra được là metric trên
Dãy Cauchy - không gian metric đầy
Một số ứng dụng của metric
Trong lý thuyết thông tin: sự sai lệch các đoạn mã và ký tự
Với lượng thông tin khổng lồ được truyền qua điện thoại, Internet hay từ vệ tinh ngoài không gian đến Trái Đất,... Điều này cực kỳ quan trọng nếu đảm bảo sự nguyên vẹn của thông tin khi nhận được.[5]
Khoảng cách Hamming
Khoảng cách Hamming là cái tên được đặt theo tên của Richard Hamming, người giới thiệu lý thuyết này trong tài liệu có tính cơ sở của ông về mã phát hiện lỗi và sửa lỗi (error-detecting and error-correcting codes). Nó được sử dụng trong kỹ thuật viễn thông để tính số lượng các bit trong một từ nhị phân (binary word) bị đổi ngược, như một hình thức để ước tính số lỗi xảy ra trong quá trình truyền thông, và vì thế, đôi khi, nó còn được gọi là khoảng cách tín hiệu (signal distance). Việc phân tích trọng lượng Hamming của các bit còn được sử dụng trong một số ngành, bao gồm lý thuyết tin học, lý thuyết mã hóa, và mật mã học. Tuy vậy, khi so sánh các dãy ký tự có chiều dài khác nhau, hay các dãy ký tự có xu hướng không chỉ bị thay thế đi, mà còn bị ảnh hưởng bởi dữ liệu bị chèn thêm vào, hoặc bị xóa đi, phương pháp đo đạc phức tạp hơn.
Trong lý thuyết thông tin, khi một thông tin được chuyển đi, ví dụ như khi gửi 1 tin nhắn, giả sử nó được mã hóa dưới dạng nhị phân gồm hữu hạn các dãy ký tự 0,1. n phần tử như vậy được gọi là 1 từ có chiều dài n.
Mỗi từ có chiều dài n như vậy có thể xem như một vector có chiều dài n gồm toàn bộ các ký tự chỉ chứa những số 0 và 1. Tập tất cả các ký tự như vậy được viết là . Do đó là tích của n cặp .
Định nghĩa một metric giữa 2 từ trên tập này là số các vị trí mà tại đó chúng khác nhau.
Metric này được gọi là khoảng cách Hamming.
Ký hiệu là
Ví dụ: Cho 2 đoạn mã nhị phân
và
.
Theo trên khác nhau ở các vị trí thứ 2,4 và 9 nên
Đối với trình tự DNA (DNA Sequence) và trong khoa học máy tính
Như đã trình bày ở mục trên: "khi so sánh các dãy ký tự có chiều dài khác nhau, hay các dãy ký tự có xu hướng thay thế, mất, chèn,... phức tạp hơn, như khoảng cách Levenshtein (Levenshtein distance) là một phương pháp có tác dụng và thích hợp hơn."
Ngoài ra, trong các thuật toán của bộ môn khoa học máy tính, khái niệm khoảng cách Levenshtein thể hiện khoảng cách khác biệt giữa 2 chuỗi ký tự. Khoảng cách này được đặt theo tên Vladimir Levenshtein, người đã đề ra khái niệm này vào năm 1965. Nó được sử dụng trong việc tính toán sự giống và khác nhau giữa 2 chuỗi, như chương trình kiểm tra lỗi chính tả của winword spellchecker.
Khoảng cách Levenshtein
Khoảng cách Levenshtein giữa dãy x và y xác định bởi:
Trong đó:
(insertions in sequence) đại diện cho số các phần tử chèn vào trong dãy.
(deletions in sequence) đại diện cho số phần tử bị xóa đi.
(replacements in sequence) chỉ số những vị trí bị thay thế.
Do đó, số tối thiểu các phép chèn, xoá đi và thay thế để biến đổi X thành Y hay khoảng cách Levenshtein giữa X và Y là:
Một số tính chất, định nghĩa khác của không gian metric
Một số định nghĩa liên quan
Định nghĩa
Cho là 2 metric trên X. 2 metric này gọi là tương đương nếu tồn tại sao cho
.
Ví dụ
3 metric và là tương đương với nhau trên :
2 metric và không tương đương với nhau trên X nhưng sinh ra cùng topo trên X
Định nghĩa
Cho là không gian metric, một tập con gọi là chặn theo d nếu tồn tại sao cho ;.
Nếu bản thân X bị chặn theo d thì nói d là metric bị chặn.[6]
Định nghĩa
Cho là không gian metric, một song ánh được gọi là đẳng cấu đẳng cự (isometry) nếu ,
Nếu là một isometry thì có thể nói các không gian metric X,Y là đẳng cự (isometric)
[7].
Định nghĩa
Cho là không gian topo, X là không gian mêtric hóa được (metrizable) nếu tồn tại một metric d trên X mà nó sinh ra topo trên X[8].
Ví dụ:
Xét topo Euclid trên đường tròn như một không gian con thừa hưởng topo Euclid trên mặt phẳng .
Topo này metric hóa được do:
Một cơ sở trên có được bằng cách giao các quả cầu mở trong với .
Xét metric trên được xác định bằng cách đặt (tính theo radian) là góc không âm nhỏ nhất sao cho đường tròn điểm p và q trùng nhau.
Với metric này, các quả cầu mở sẽ là những khoảng mở trên đường tròn nên cơ sở của các quả cầu mở cho topo trên sinh ra bởi có cùng cơ sở như topo Euclid trên .
Các định lý
Định lý
Mọi không gian metric đều tách được theo (T.4)[9].