
Hızlı Bakış: Yapay Zeka Şifreleri Nasıl Kırıyor?
Yapay zeka artık yalnızca metin yazmak veya görüntü tanımakla kalmıyor; tarihî, şifreli belgelerin çözümünde hız ve ölçek avantajı sağlıyor. Stockholm, Oslo ve Nancy gibi üniversite laboratuvarlarından gelen ekipler, makine öğrenmesi, biçimsel istatistik ve büyük dil modellerini birleştirerek Borg Şifresi, Copiale ve benzeri metinlerin kilidini açtı. Bu makalede uygulanan adımları, karşılaşılan zorlukları, somut örnekleri ve araştırmacıların geliştirdiği pratik yöntemleri adım adım, veriye dayalı şekilde açıklıyorum.

1) Dijitalleştirme: Şifre çözümünün temeli
El yazması bir belge fiziksel hâlden dijital ortama aktarılırken üç kritik unsur kontrol edilir: yüksek çözünürlüklü tarama, renk doğruluğu ve çoklu spektral görüntüleme. Çoklu spektral görüntüleme solmuş mürekkebi, farklı dönem katmanlarını ve silik düzeltmeleri ortaya çıkarır. Örnek: Von Wandersleben’in mektubunda, 17. yüzyıl Almancası kısımları normal ışıkta okunurken; şifreli bloklar çoklu spektral taramayla netleşti. Tarama sonrası, görüntüler Transkribus veya benzeri OCR-uyumlu platformlara yüklendi.

2) Otomatik transkripsiyon vs. doğrudan şifre çözümü
Geleneksel akış iki aşamalıdır: önce transkripsiyon, sonra kriptanaliz. Transkribus gibi araçlar el yazısını karakter karakter dijitalleştirir; ancak sıra dışı semboller, astrolojik işaretler veya rastgele eklenmiş maskeler zorlar. Yeni yaklaşımlar bu iki aşamayı birleştiriyor: görüntüden doğrudan sembol-dizilerine ve olası harf eşlemelerine ulaşan derin öğrenme modelleri geliştiriliyor. Copiale örneğinde araştırmacılar önce sistemi çözülmüş örneklerle eğitti, ardından daha önce görülmemiş bölümleri başarıyla çevirdi.

3) Frekans analizi ve istatistiksel yöntemler
Basit yerine koyma şifrelerinde harf sıklığı analizleri hâlâ etkilidir. Uygulama adımları:
Adım 1: Sembol frekansını hesapla (örneğin E’nin yerine geçen sembolün toplam kullanımı).
Adım 2: Hedef dilde beklenen harf dağılımı ile eşleştir (İngilizce’de E en sıkken, Türkçe’de A, E, İ öne çıkar).
Adım 3: Çiftlik (digram) ve üçlü (trigram) analizlerini uygula; bu, tek harf eşlemelerinin yanlış olduğu durumlarda bağlam sağlar.
Bu yöntem V. Charles’ın mektubunda 120 sembollük karmaşa içinde bile bazı anahtar kelimeleri ortaya çıkardı.
4) Deneme-yanılma: İnsan uzmanlığıyla hibrit iş akışı
Makine önerir, uzman doğrular. Michelle Waldispühl’ün çalışmasında otomatik dönüşüm hatalarını eski Almanca bilgisiyle düzeltilerek nihai metin elde edildi. Pratik iş akışı:
a) Modelin en iyi 5 olası eşlemesini al.
b) Uzman bu seçenekleri dil bilgisi, tarihsel isimler ve bağlamla test eder.
c) Doğrulamalar modele geri beslenir (active learning) ve model güncellenir.
5) Derin öğrenme ve büyük dil modellerinin rolü
Büyük dil modelleri (LLM) örüntü tahmini ve bağlamsal doldurma açısından güçlüdür. Megyesi’nin ekibi, şifre karakterleri ile karşılık gelen metinler üzerinde eğitilmiş özel çözümleme ağlarıyla LLM’leri birleştirdi. Sonuç: Borg’un 500 sembollük bölümü sohbet robotu tarzı bir model tarafından ~29 dakikada çevrildi ve İngilizce çevirisi üretildi. Model ayrıca çözümün gerekçesini adım adım sundu; bu, yorum üretme riskini azaltır.
6) Kısıtlar ve yanlış pozitifleri azaltma stratejileri
Olası tuzaklar: sahte ipuçları, çoğaltılmış semboller, dilin bilinmemesi. Çözüm önerileri:
– Çapraz kaynak doğrulaması: tarihsî bağlam, tarihî isim veri tabanları ve coğrafi verilerle eşleştir.
– Çok dilli modeller: aynı metnin farklı dil hipotezleriyle yeniden değerlendirilmesi.
– İnsan-in-the-loop: model her kritik eşlemeyi bir güven skoruyla verir; düşük skor insan onayı ister.
7) Uygulamalar: Tarih, arkeoloji ve kültürel miras
Çözülen şifrelerin etkisi büyük: Mary, Queen of Scots’un mektupları politik tarih yeniden yazdı; Copiale, 18. yüzyıl gizli törenlerini açığa çıkardı. Gelecekte, Phaistos Disk’i veya Linear A gibi antik yazıtlar için benzer hibrit yöntemler umut veriyor — ancak bu yazıtlar için veri kıtlığı büyük engel. Araştırmacılar yüz binlerce örnek yerine binlerce yüksek kaliteli, etiketli örnek toplamanın daha verimli olduğunu gösteriyorlar.
8) Pratik rehber: Bir şifreli belgeyi çözmek istiyorsanız adım adım
1) Yüksek çözünürlüklü çoklu spektral tarama yapın.
2) Görüntüleri OCR+Transkripsiyon araçlarında ilk geçişe sokun.
3) Sembol frekanslarını hesaplayın; digram/trigram analizleri yapın.
4) Makine öğrenimi modelleriyle olası eşlemeleri üretin.
5) Dil uzmanlarıyla iteratif doğrulama ve geri besleme döngüsü kurun.
6) Sonuçları tarihsel veri tabanlarıyla çapraz kontrol edin ve çözümün mantığını belgeleyin.
9) Veri ve etik: Arşivler neden kritik?
Yapay zekanın başarısı büyük, etiketli veri üzerinde yükselir. Araştırmacılar şu anda arşivlerdeki şifreli materyallerin toplanmasına yatırım yapıyor; tahmini olarak arşivlerdeki materyalin ~%1’i kısmen veya tamamen şifreli. Etik açıdan şifre çözümü, kişisel gizlilik veya telif hakkı meseleleri doğurabilir; bu nedenle projeler genellikle arşiv sahipleriyle sözleşmeli ve şeffaf işliyor.
10) Hemen uygulanabilir ipuçları
– Başlangıç için Transkribus veya açık kaynak görüntü tanıma araçlarını deneyin.
– Elinizdeki belgenin benzer örneklerini veri olarak toplayın; birkaç yüz etiketli örnek bile dönüşüm hızını arttırır.
– Modelin verdiği çözümün nedenini talep edin; açıklanabilirlik, yanlış pozitifleri yakalamak için kritik.

İlk yorum yapan olun