İng. open reading frame (ORF)
Bir Açık Okuma Çerçevesi (ORF), DNA veya RNA’da bir başlangıç kodonuyla (tipik olarak RNA’da AUG, DNA’da ATG‘ye karşılık gelir) başlayan ve üç durdurma kodonundan biriyle (RNA’da UAA, UAG, UGA; DNA’da TAA, TAG, TGA) biten sürekli bir nükleotid dizisidir. ORF’ler genetik kodlama dizilerinin temel unsurlarıdır çünkü genomun proteinlere çevrilme potansiyeline sahip bölgelerini temsil ederler.

Başlangıç Kodonu:
- ORF’ler tipik olarak çevirinin başladığını işaret eden bir başlangıç kodonu ile başlar. Çoğu organizmada bu kodon metiyonin (Met) amino asidini kodlar.
- Çevreleyen nükleotid dizisi (ökaryotlarda Kozak dizisi veya prokaryotlarda Shine-Dalgarno dizisi) gibi başlangıç kodonunun bağlamı translasyonun başlamasını etkiler.
Durdurma Kodonu:
- ORF’ler üç durdurma kodonundan birinde sonlanır. Bu kodonlar bir amino asit kodlamaz, bunun yerine ribozoma translasyonu sonlandırması için sinyal göndererek sentezlenen polipeptidi serbest bırakır.
Uzunluk:
- ORF’lerin uzunluğu değişir. Daha uzun ORF’lerin işlevsel proteinleri kodlama olasılığı daha yüksektir, ancak tanımlanan tüm ORF’ler protein üretimiyle sonuçlanmaz.
İplik Yönü:
- ORF’ler DNA’nın hem duyu (kodlama) hem de antisens (kodlamayan) ipliklerinde bulunabilir, bu da bir genomik diziyi analiz ederken altı olası okuma çerçevesinin (her iplikte üç) tümünü değerlendirmeyi gerekli kılar.
Protein Kodlama Potansiyelinin Tahmini
ORF’leri tanımlamak ve protein kodlama potansiyellerini tahmin etmek için biyoinformatik araçlar kullanılır. Bu tahmini etkileyen özellikler şunlardır:
- Kodon Kullanım Yanlılığı: Fonksiyonel ORF’ler genellikle organizmanın tercih ettiği kodonları yansıtan kodon kullanım modelleri sergiler.
- Uzunluk Eşikleri: Daha uzun ORF’lerin işlevsel proteinleri kodlama olasılığı daha yüksektir.
- Sekans Korunumu: Türler arasında korunan ORF’lerin işlevsel rollere sahip olma olasılığı daha yüksektir.
- Düzenleyici Unsurların Varlığı: Promoter dizileri ve çevrilmemiş bölgeler (UTR’ler) transkripsiyon ve çeviri potansiyelini gösterebilir.
Genomik Çalışmalarda ORF’ler
Gen Açıklama:
- ORF’ler, bir genom içindeki genlerin açıklanmasında temeldir ve kodlama dizilerini kodlama yapmayan bölgelerden ayırmaya yardımcı olur.
Yeni Protein Keşfi:
- ORF analizi, özellikle İnsan Genom Projesi gibi büyük ölçekli projelerde veya mikrobiyal metagenomik çalışmalarında, daha önce bilinmeyen proteinlerin tanımlanmasını sağlar.
Sentetik Biyolojideki Uygulamalar:
- ORF’ler sentetik genlerin tasarlanmasında ve biyoteknolojik uygulamalar için ifade sistemlerinin oluşturulmasında kullanılır.
ORF’ler ve Kodlamayan RNA’lar
Tüm ORF’ler işlevsel proteinlere yol açmaz. Bazı kısa ORF’ler (sORF’ler) veya yukarı akış ORF’leri (uORF’ler) protein üretmeden gen ifadesini düzenleyebilirken, diğerleri rastgele dizilerden kaynaklanan yanlış pozitiflerdir.
Prokaryotlarda ve Ökaryotlarda ORF’ler
Prokaryotik ORF’ler:
- Prokaryotlarda ORF’ler genellikle birden fazla genin tek bir mRNA olarak transkribe edildiği operonlarda bulunur.
- Prokaryotik ORF’ler genellikle intronlardan yoksundur, bu da tanımlanmalarını kolaylaştırır.
Ökaryotik ORF’ler:
- Ökaryotlarda ORF’ler intronlar tarafından kesilir ve bunlar RNA işleme sırasında eklenir.
- Ökaryotik genomlarda ORF’lerin tanımlanması, kodlayıcı ekzonlar ile kodlayıcı olmayan intronlar arasında ayrım yapılmasını gerektirir.
Klinik ve Araştırma Çıkarımları
Hastalık Araştırması:
- ORF’lerdeki mutasyonlar işlevsiz proteinlere yol açabilir ve çeşitli genetik bozukluklarla bağlantılıdır.
İlaç Geliştirme:
- Enzimleri veya reseptörleri kodlayan ORF’ler genellikle ilaç tasarımında hedeflenir.
Evrimsel Çalışmalar:
- Karşılaştırmalı ORF analizi, türler arasındaki evrimsel ilişkileri ve işlevsel korunumu ortaya koymaktadır.
ORF Tanımlama Araçları
ORFfinder, GENSCAN ve GeneMark gibi biyoinformatik araçlar ve yazılımlar, nükleotid dizilerindeki ORF’leri tanımlamak için yaygın olarak kullanılır. Bu araçlar, kodlama potansiyelini tahmin etmek için başlangıç / durdurma kodonlarını, kodon kullanımını ve diğer dizi özelliklerini değerlendiren algoritmaları kullanır.
Keşif
1. Moleküler Biyolojinin Merkezi Dogması (1958)
1958 yılında Francis Crick genetik bilgi akışını tanımlayan moleküler biyolojinin temel dogmasını dile getirdi: DNA, RNA’ya kopyalanır, RNA da proteinlere çevrilir. Bu temel kavram, artık ORF’ler olarak tanınan DNA’daki belirli dizilerin protein sentezi için talimatları nasıl kodladığını anlamak için bir çerçeve sağladı. ORF terimi henüz icat edilmemiş olsa da, Crick’in çalışması DNA’da çeviri potansiyeli olan bölgelerin varlığının altını çizdi.
2. Genetik Kodun Keşfi (1961-1965)
Genetik kodun Marshall Nirenberg, Har Gobind Khorana ve Robert Holley gibi araştırmacılar tarafından deşifre edilmesi çığır açan bir başarıydı. Nükleotid üçlülerinin veya kodonların amino asitleri nasıl belirlediğini ortaya çıkardılar. Bu keşif, ORF’leri anlamak için çok önemliydi, çünkü bu dizileri tanımlamada başlangıç ve bitiş kodonlarının önemini vurguladı. Kodonların tanımlanması, ORF’lerin protein kodlayan bölgeleri nasıl tahmin edebileceğini de açıklığa kavuşturarak DNA dizileri ile işlevsel proteinler arasında doğrudan bir bağlantı sağladı.
3. mRNA’nın Tanımlanması ve Translasyondaki Rolü (1961)
Mesajcı RNA’nın (mRNA) Sydney Brenner, François Jacob ve Matthew Meselson tarafından keşfi, DNA’daki genetik bilginin protein sentezi için ribozoma nasıl aktarıldığına dair yeni bir anlayış getirdi. mRNA’nın ORF’lere karşılık gelen kodlama dizilerini taşımadaki rolü, onu genetik talimatların işlevsel proteinlere çevrilmesinde merkezi bir oyuncu haline getirdi.
4. Başlangıç ve Durdurma Kodonlarının Tanınması (1960’lar)
1960’larda araştırmacılar başlangıç kodonunu (AUG) ve durdurma kodonlarını (UAA, UAG, UGA) tanımladılar. Bu dönüm noktası, bilim insanlarının ORF’lerin sınırlarını belirlemelerine, çevirinin nerede başlayıp nerede bittiğini işaretlemelerine olanak sağladı. Bu keşif, DNA dizilerindeki ORF’leri sistematik olarak tanımlamak için gerekli araçları sağladı.
5. DNA Dizilemesindeki Gelişmeler (1977)
İlk DNA dizileme yöntemlerinin Frederick Sanger ve Walter Gilbert tarafından geliştirilmesi moleküler biyolojide devrim yarattı. İlk kez, tüm genomları dizilemek ve ORF’leri hesaplamalı olarak tanımlamak mümkün hale geldi. Bu teknikler, potansiyel protein kodlayan bölgelerin yerlerini ortaya çıkardı ve genler tarafından kodlanan proteinlerin tahmin edilmesini sağladı. Bakteriyofaj λ gibi ilk viral genomların dizilenmesi, kompakt genetik materyalde ORF’lerin varlığını göstermiştir.
6. Biyoinformatik ve ORF Tahmin Araçlarının Ortaya Çıkışı (1980’ler-1990’lar)
Genom dizileme projeleri genişledikçe, ORF tanımlama için biyoinformatik araçlar ortaya çıktı. GENSCAN** ve ORFfinder gibi programlar, başlangıç ve bitiş kodonları için nükleotid dizilerinin taranması sürecini otomatikleştirerek araştırmacıların tüm genomlar boyunca protein kodlayan bölgeleri tahmin etmesine olanak sağladı. Bu araçlar, büyük ölçekli genomik ek açıklamanın yeni bir çağına işaret etti ve çeşitli organizmalarda ORF’lerin her yerde bulunduğunu ortaya çıkardı.
7. İnsan Genom Projesi (1990-2003)
İnsan genomunun sıralanması, bilim insanlarının tüm protein kodlayan genleri açıklamaya çalışmasıyla ORF’leri ön plana çıkarmıştır. ORF analizi, insanlardaki yaklaşık 20.000 protein kodlayan genin tanımlanmasında çok önemli bir rol oynamıştır. Proje ayrıca ökaryotik ORF’lerin intronlar ve çevrilmemiş bölgeler de dahil olmak üzere karmaşıklığını ortaya çıkararak sofistike hesaplama yaklaşımlarına olan ihtiyacı vurgulamıştır.
8. Kısa ORF’lerin (sORF’ler) Keşfi ve Düzenleyici Rolleri (2000’ler)
2000’lerin başında araştırmacılar, daha önce kodlama yapmadığı düşünülen bölgelerde kısa açık okuma çerçeveleri (sORF’ler) tanımlamaya başladı. Bu keşifler, tüm ORF’lerin işlevsel proteinler ürettiği fikrine meydan okuyarak bazılarının küçük peptitleri kodladığını veya gen ifadesini düzenlediğini ortaya çıkardı. ORF’lere ilişkin bu genişletilmiş anlayış, kodlamayan RNA’lar ve yukarı akış düzenleyici mekanizmalarındaki işlevsel çeşitliliklerini ve önemlerini vurgulamıştır.
9. CRISPR-Cas Sistemleri ve Fonksiyonel Genomik (2010’lar)
CRISPR-Cas9’un bir genom düzenleme aracı olarak geliştirilmesi, ORF’lerin hassas bir şekilde manipüle edilmesini sağladı. Araştırmacılar artık protein sentezi ve gen düzenlemesindeki rollerini incelemek için başlangıç ve bitiş kodonlarını düzenleyebilirler. Bu dönüm noktası, ORF analizini fonksiyonel genomik ile entegre ederek tahmin edilen protein kodlama bölgelerinin deneysel olarak doğrulanmasına olanak sağlamıştır.
10. Mevcut ve Gelecekteki Sınırlar
Günümüzde ORF araştırmaları genomik ve sentetik biyolojinin ön saflarında yer almaktadır. Uzun kodlamayan RNA’lardaki (lncRNA’lar) gibi kanonik olmayan ORF’lerin incelenmesi, genomik karmaşıklığın yeni katmanlarını ortaya çıkarmaktadır. Derin öğrenme algoritmaları** gibi araçlar ORF tahminini daha da geliştirerek daha önce gözden kaçan dizilerdeki yeni protein kodlama potansiyelini ortaya çıkarıyor.
İleri Okuma
- Shine, J., & Dalgarno, L. (1975). Determinant of cistron specificity in bacterial ribosomes. Nature, 254(5495), 34–38.
- Kozak, M. (1986). Point mutations define a sequence flanking the AUG initiator codon that modulates translation by eukaryotic ribosomes. Cell, 44(2), 283–292.
- Borodovsky, M., & McIninch, J. (1993). GeneMark: Parallel gene recognition for both DNA strands. Computers & Chemistry, 17(2), 123–133.
- Gish, W., & States, D. J. (1993). Identification of protein coding regions by database similarity search. Nature Genetics, 3(3), 266–272.
- Lowe, T. M., & Eddy, S. R. (1997). tRNAscan-SE: A program for improved detection of transfer RNA genes in genomic sequence. Nucleic Acids Research, 25(5), 955–964.