Cặp bazơ (viết tắt tiếng Anh là
bp trong
base pair) hay
cặp cơ sở là một đơn vị gồm hai
nucleobazơ liên kết với nhau bởi các
liên kết hydro. Chúng tạo thành những khối cấu trúc của đường xoắn kép
ADN, và đóng góp vào cấu trúc gập của cả ADN và
ARN. Được điều khiển bởi những kiểu
liên kết hydro cụ thể, cặp bazơ Watson-Crick (
guanine-
cytosine và
adenine-
thymine) cho phép các chuỗi xoắn ADN duy trì một cấu trúc xoắn ốc thông thường mà phụ thuộc một cách tinh tế vào
trình tự nucleotit của nó.
[1] Đặc tính
bổ sung của cấu trúc nhóm bazơ này cung cấp một bản sao dự phòng của tất cả
thông tin di truyền được mã hóa bên trong ADN sợi kép. Cấu trúc thông thường và sự dư thừa dữ liệu cung cấp bởi chuỗi xoắn kép ADN đã khiến ADN rất phù hợp với việc lưu trữ thông tin di truyền, trong khi đó việc ghép cặp bazơ giữa ADN và các nucleotit mới tới cung cấp một cơ chế mà qua đó
DNA polymerase sao chép lại ADN, và
RNA polymerase sao chép ADN thành ARN. Nhiều protein liên kết ADN có thể nhận ra kiểu cặp bazơ cụ thể có nhiệm vụ nhận diện những vùng gien điều hòa riêng biệt.Các cặp bazơ nội phân tử có thể xuất hiện bên trong các axit nucleic sợi đơn. Điều này đặc biệt quan trọng trong các phân tử ARN (ví dụ
ARN vận chuyển), nơi cặp bazơ Watson-Crick (guanine-cytosine và adenine-
uracil) cho phép sự hình thành của các đường xoắn kép ngắn, và một số lượng đa dạng các tương tác không phải Watson-Crick (như G-U hay A-A) cho phép các ARN gập thành một phạm vi rộng lớn các cấu trúc ba chiều đặc trưng. Thêm nữa, việc ghép cặp bazơ giữa
ARN vận chuyển (tARN) và
ARN thông tin (mARN) hình thành nên nền tảng cho các sự kiện ghi nhận phân tử, thứ dẫn đến việc trình tự nucleotit của mARN được
phiên dịch thành trình tự axit amin
protein thông qua
mã di truyền.Kích thước của từng
gen hoặc toàn bộ
bộ gen của một sinh vật thường được đo theo đơn vị cặp bazơ bởi vì ADN thường là sợi kép. Do đó, số lượng tổng các cặp bazơ thì bằng với số nucleotit ở một trong số những sợi trên(với ngoại lệ là các vùng đơn sợi không mã hóa của
telomere). Bộ gien đơn bội của người (23
nhiễm sắc thể) được ước tính dài khoảng 3,2 triệu bazơ và chứa 20.000–25.000 gien mã hóa protein riêng biệt.
[2][3][4] Một kilobazơ (kb) là một đơn vị đo trong
sinh học phân tử bằng với 1000 cặp bazơ của ADN hoặc ARN.
[5] Tổng lượng cặp bazơ ADN liên kết trên Trái Đất ước tính vào 5.0 × 1037, và nặng 50 tỷ
tấn.
[6] Để so sánh thì tổng sinh khối của
sinh quyển đã được ước tính nặng 4
TtC (hàng nghìn tỷ tấn
carbon).
[7]