Burak Selim Şenyurt - Algoritma

Blockchain Eliptik Eğri Şifreleme Algoritması

2018-07-24T07:00:00+00:00

Merhaba Arkadaşlar,

Matematik tek evresenl dil olarak varoluşumuzdan bu yana yaşamın içerisinde. Onun diğer bilimlere olan pozitif etkisi tartışılamaz. Bugün ulaştığımız noktada teknoloji sınırlarını zorlarken yüz yıllar öncesinden ispat edilmiş pek çok teoremin uygulanabilirliklerine de rastlıyoruz. Doğruyu söylemek gerekrise 1999 yılında ilk işe başladığımdan beri matematik'ten epey uzakta sadece kod yazmaktayım. Belki de bugün .Net Core'un Linux üzerinde koşturulup bir Cloud platformuna taşınması da önemli bir mevzu. Lakin o hayranlık duyduğumuz fikirlerin arkasında, çok fazla ilişmediğimiz(belki de bakmaya korktuğumuz) güçlü bir matematik var. Bende büyük bir cesaretle o fikirlerden birisinin arkasında olan matematiği bir nebze olsun anlamak istedim. Matematik kesin kuralları olan bir dil olduğu içi, yazdığım şeyleri doğru telafüz etmem gerekiyor. Eğer basit bir şekilde anlatabilirsem, konuyu da anlamış sayılırm(Son gün notu: Basitleştiremedi)

Geçtiğimiz iki hafta boyunca neredeyse her gün yarım saatimi ayırdığım ve anlamak için çaba sarf ettiğim bir konu oldu. Blockchain'in kullandığı Elliptic Curve Cryptography(ECC) algoritmasının nasıl çalıştığını öğrenmek. Araştırmalarıma başladığımda olayın içerisinde matematiğin bilgisayar şifreleme teknikleri üzerine kullanılan bir çok teorisine denk geldim. 1993 yılında girdiğim Matematik Mühendisliği bölümünde okurken gördüğüm pek çok konu burada da yer alıyordu. Ama zaman içerisinde hepsini unutmuşum. İkinci ve üçüncü dereceden denklemler, eliptik eğriler, asal sayılar, gruplar, sonlu alanlar(Finite Fields), Fermat'nın küçük teoremi(Little Theorem), modüler aritmetik, ayrık logaritma problemi(discrete logarithm problem), double and add algoritması, euclid vs... Aslında her şey Blockchain sisteminde yer alan eliptik eğri denklemine ait grafik gösterimin, gerçek sayılar ile ifade edileninden çok daha farklı olduğunu öğrenmemle başladı diyebilirim.

Örneğin Bitcoin, secp256k1 isimli ve aşağıdaki eşitlikle ifade edilen eliptik eğri denklemini kullanmakta. secp256k1' deki sec, Standards for Efficent Cryptography anlamına gelirken 256 değeri asal sayının kaç bit olduğunu ifade etmektedir. Sonlara doğru bu kavramları anlayacağım/anlatabileceğim diye umut ediyorum.

y²=x³+7

Gerçek sayılar için olan gösterimi şöyle;

Toplam eleman sayısı asal olacak şekilde oluşturulmuş bir sonlu alan dizilimi için olan gösterimi ise şu şekilde;

Merak uyandırdı değil mi? Öyleyse ilk konumuz ile başlayalım.

Eliptik Eğriler

Eliptik eğri denklemlerine geçmeden önce bir kaç basit denklemi de hatırlamamız lazım. Doğrusal, ikinci dereceden ve üçüncü dereceden denklemleri ve x,y düzlemindeki gösterimlerini görünce sizler de hatırlayacaksınız?

y=ax+b , doğru denklemi

y=ax²+bx+c , parabol denklemi

y=ax³+bx²+cx+d , 3ncü dereceden denklem

ve tabii konumuz olan eliptik eğri denklemi.

y²=x³+ax+b

Yukarıdaki şekilde denkleme ait bir kaç farklı örnek görmektesiniz. Her ne kadar ben çok iyi çizemesemde, özellikle x ekseni özelinde simetriklik olduğunu söyleyebiliriz. Bazı hallerde iki ayrı eğri ve bazı hallerde de bu iki eğrinin birleştiği grafikler söz konusu. y² den kaynaklı bir durum olduğu aşikar. Eliptik eğrilerin enteresan bir özelliği de vardır. Eğri üzerinde olduğu bilinen iki koordinat söz konusu olduğunda, bu koordinatların x değerleri birbirinden farklı olmak şartıyla, her iki koordinatın toplamından yine eğri üzerine denk düşen 3ncü bir koordinatı bulmamız mümkündür. Bulunuş şekli matematik severler için hayranlık uyandırıcıdır. Aşağıdaki şekille konuyu anlatmaya çalışayım.

Şekilde M₃noktasını bulunuşu ifade edilmektedir. Olay şöyle başlar. Eğri üzerinden bilinen iki nokta referans alınır. x değerleri birbirlerinden farklı olan iki nokta. Bu noktaların üstünden geçen bir doğru çizilir. Çizilen doğru eğriyi 3ncü bir noktada daha kesecektir(örneğimizdeki P noktası) Bu noktanın iz düşümü de simetrik taraftaki bir noktaya denk gelmektedir(örneğimizdeki M₃) İşte teoriye göre M₁ ve M₂ noktalarının toplamı M₃ noktasını elde etmemizi sağlamaktadır. Tabii toplam dediğimiz olay biraz daha farklı. Noktayı bulmak için aşağıdaki gibi sıralanmış bir formül takımından yararlanılır.

3ncü noktanın bulunmasında ilk iki noktanın sıralı olması şart değildir. Sadece eğri üzerinde olduğu bilinen iki noktanın üzerinden geçen doğrunun kestiği üçüncü noktanın x düzlemindeki iz düşümü önemlidir.

Eğri denklemimiz : y²= x³+ ax + b

M1 = (x1,y1) , M2 = (x2,y2), M1 + M2 = (x3,y3)

x1 ve x2 eşit olmadığı sürece

Eğim s = (y₂ - y₁) / (x₂ - x₁)

x₃ = s²- x₂ - x₁

y₃ = s(x₁ - x₃) - y₁

Kafamızı çok fazla bulandırmadan 3ncü nokta bulmanın nasıl yapıldığını basit bir örnekle inceleyelim.

y²=x³+5x+7
P₁ = (2,5) , P₂ = (3,7) => P₃ = ?

5²= 25 = 2³+(5*2)+7 (P₁ noktası eğri üzerinde)
7²= 49 = 3³+(5*3)+7 (P₂ noktası eğri üzerinde)

s = (7 - 5) / (3 - 2) = 2 (Eğimi bulduk)
x₃ = 2²- 2 - 3 = -1
y₃ = 2(2 - (-1) ) - 5 = -1

P₃ = (-1,1)
1²= 1 = -1³+(5*(-1))+7 (P₃ noktası eğri üzerinde)

Şimdi örnekte neler oldu anlamaya çalışalım. Denklem ortada. İki tane noktamız var. Öncelikle bu noktaların eğri üzerinde olup olmadıklarının sağlamasını yapıyoruz. Sonrasında eğim değerini(s) bulmamız gerekiyor. Eğim bulunduktan sonra bu değerden yararlanarak x₃ bilinmeyenini ve x₃'ü de işin içerisine katarak y₃ değerini hesaplıyor ve 3ncü noktanın koordinatlarını bulmuş oluyoruz. Son aşamada yine x₃,y₃ noktasının eliptik eğri üzerinde olup olmadığının sağlamasını gerçekleştiriyoruz. Bunu program kodu ile de deneyimleyebiliriz. Özellikle Python gibi diller bu tip matematiksel işlemler için kolaylıklar sunmakta.

p1=(2,5)
p2=(3,7)

def isOnCurve(p):
    """    
    p1 egri ustunde mi bakalim
    """
    (x,y)=p1
    return y**2 == x**3+(5*x)+7

def findSlope(p1,p2):
    """
    p1 ve p2den yararlanarak egimi buluyoruz
    """
    (x1,y1)=p1
    (x2,y2)=p2
    s=(y2-y1)/(x2-x1)
    return s

def findThirdPoint(p1,p2,s):
    """
    p1 ve p2den yararlanip 3ncu noktanin bulunmasi
    """
    (x1,y1)=p1
    (x2,y2)=p2
    x3=s**2-x2-x1
    y3=s*(x1-x3)-y1
    return (x3,y3)

print p1,"is on curve?",isOnCurve(p1)
print p2,"is on curve?",isOnCurve(p2)
print findSlope(p1,p2)
print findThirdPoint(p1,p2,findSlope(p1,p2))

Python tarafına aşina olmayanlar için bile okunması oldukça kolay bir kod parçası görmektesiniz. x,y koordinatlarını işaret eden noktaları tuple tipi ile işaret etmekteyiz. Bu bir noktanın x ve y değerlerini taşırken veya elde ederken işlerimizi kolaylaştırmakta. isOnCurve fonksiyonu parametre olarak verilen noktanın eğri üzerinde olup olmadığını kontrol ediyor. findSlope metodu ile tahmin edeceğiniz üzere eğim değerini buluyoruz. findThirdPoint fonksiyonu p1 ve p2 parametrelerinden yararlanılarak p3ün yani 3ncü noktanın bulunmasında kullanılmakta. Kodu Visual Studio Code üzerinde geliştirebilirsiniz. Şahsen ben, öyle yaptım.

Eliptik Eğrilerin Gruplar ile İlişkisi

Eliptik eğriler ile matematik grupları arasında yakın ilişki vardır. Özellikle asallık söz konusu ise. Bunları bir eliptik eğri için düşündüğümüzde şunları söyleyebiliriz.

G'yi noktaların olduğu bir grup olarak düşünürsek iki noktanın toplamı (P₁ + P₂ = P₃) yine G'nin içinde yer alacaktır(Kapalılık özelliği)
P₁ + P₂ + P₃ = 0 aynı hat üzerinde 3 nokta söz konusu olduğunda toplam sonucu 0 olarak çıkar(Tabii noktaların hiçbirisi 0 olmayacak)
Grubun mutlaka şu eşitliği sağlayan bir birim elemanı vardır ki eliptik eğriler için 0 olduğunu söyleyebiliriz. P₁ + 0 = 0 + P₁ = P₁
Her bir noktanın x ekseninde bir simetrisi vardır.
Eğer değişebilirlik ( P₁ + P₂ = P₂ + P₁ ) söz konusu ise bu grup Abelian(Değişmeli diyebiliriz) olarak isimlendirilir(Abelian olmanın avantajları nelerdir halen araştırıyorum sevgili okur)

Grup olma özellikleri biraz sonra kriptografinin zorluğunu ortaya koyarken değer kazancak. Bu nedenle eliptik eğri kriptografisine geçmeden önce sonlu alanlara, asal sayılar nezninde de uğramamız gerekiyor.

Sonlu Alanlar

Artık eliptik eğrilerin nasıl bir denklem ile ifade edildiğini biliyoruz. Yazının başında Blockchain tarafından kullanılan denklemin grafiğini hatırlarsanız gerçek sayılar yerine toplam eleman sayısı bir asal sayı ile ifade edilen eliptik eğrinin söz konusu olduğunu belirtmiştik. Peki ne olaki bu sonlu alanlar(Finite Fields) Aşağıdaki gibi ifade edilen bir sayı dizisi olduğunu düşünelim(Aslında bizler için 0dan başlayan 13 elemanlı bir tamsayı dizisi)

F₁₃ = {0, 1, 2, 3, … 12}

Bu dizilimin en önemli yanı 13 elemandan oluşması. 13 asal bir sayı. Dizinin bir diğer önemli özelliği de modüler aritmetik denklik kuramına göre içerideki iki sayının toplamının yine içerideki bir elemanı veriyor olması. Üstelik bu sadece toplama değil, çıkarma, çarpma ve bölme işlemleri için de geçerli bir durum. Sadece bölme işleminde kafaların biraz karışabildiği bir senaryo var ki burada da işin içerisine Fermat'nın Küçük Teorim(Fermat's Little Theorem) girmekte.

Toplama, çıkartma ve çarpma işlemlerine örnekler;

4 + 5 = 9 % 13 = 9 (Dizi içerisinde)
8 + 11 = 19 %13 = 6 (Dizi içerisinde)
8 - 12 = (-4) % 13 = 4 (Dizi içerisinde)
9 - 4 = 5 % 13 = 5 (Dizi içerisinde)

Gelelim bölme işlemine...

2 / 3 = 2 * 3^-¹= 2 * 3¹¹= 354.294 % 13 = 5 (Dizi içerisinde)
3 / 12 = 3 * 12^-¹= 3 * 12¹¹= 2.229.025.112.064 % 13 = 10 (Dizi içerisinde)

İşlemler biraz tuhaf geldi değil mi? Özellike -1 üs değerinin eşitliğin devamında 13-2 şeklinde ifade edilmesi. Burada az önce bahsettiğimiz küçük teorimin büyük bir önemi var. Fermat'a göre p bir asal sayı, a bir tamsayı ve a ile p aralarında asal(p, a'nın bir çarpanı olamaz) iken

2¹¹- 2 = 2046 % 11 = 0

gibi bir işlem'den bahsedilebilir. Modüler aritmetik notasyonuna göre ifade şudur.

a^p≡ a (mod p)

Buradan hareketle teoremin ispatı sırasında kullanılan Euler teoremine göre de

a^p-1≡ 1 (mod p)

dir. Henüz ispatını araştıramamış olsam da bu denkliklerden yola çıkılarak şu ifadenin de doğru olduğu söylenmekte.

a^p-2≡ a^-1≡ 1/a (mod p)

Böylece bir bölme işleminin modüler aritmetik enstürmanlarına göre yine dizi içerisindeki bir elemanı işaret ettiğini görmüş oluyoruz.

Eliptik Eğrideki Ayrık Logaritma Problemi

Gelelim yukarıda anlattıklarımızı kullanarak neler yapabileceğimize bakmaya. Bir eliptik eğri üzerinde bir başlangıç noktası seçtiğimizi düşünelim. P olarak isimlendirelim(Sonradan Generator Point adına kavuşacak) Buna göre P'nin 1 katını, 2katını, 3katını ekleyerek devam edelim. Artık elimizde bir nokta grubu var ve onu şöyle ifade edebiliriz.

{0, P, 2P, 3P, 4P, 5P,... (n-1)P}

Çarpan olarak ele alınan n'nin gizli bir anahtar olduğunu düşündüğümüzde her ne kadar sP=Q değerini bulmak kolay olsa da P ve Q'yi bilip s'yi bulmaya çalıştığımız durumda bu o kadar da kolay olmayacaktır. Çünkü 0 ile n-1 arasındaki tüm olası değerleri göz önüne alıp eşitliğin sağlanıp sağlanmadığını anlamamız gerekir. Bunun sebebi ayrık logaritma problemi ile açıklanmaktadır.

Discrete Logarithm Problem

Aşağıdaki işlemi düşünelim.

3²⁹mod 17 ≡ 12

Burada 12 değerine ulaşmak kolay. Fakat soru şu;

3^xmod 17 ≡ 12

Burada x değerini nasıl bulabiliriz? Aslında 3ün olası üslerini taramak söz konusu eşitlikteki uygun x değerini bulmak için yeterli. Küçük bir asal sayı için bu çok büyük sorun teşkil etmeyecektir. Sorun 17 sayısı yerine çok çok çok büyük bir asal sayı geldiğinde ortaya çıkmaktadır. Teorikte mümkün ama pratiğe dökülmesi için asal değere göre dünyadaki işlemci gücünün tamamına sahip olsak bile çok uzun yıllar sürebilecek bir problem söz konusu(Uzmanların dilinden)

Tekrar P noktalarından oluşan grubumuza dönelim. Buradaki çarpan hesaplamaları için Double and Add algoritmasından yararlanılabilir.

Double and Add algorithm

Double and Add algoritmasında noktanın çarpanının ikilik sayı sistemindeki ifadesinden yararlanılır. Şöyle başlayalım. 19 asal sayısının ikilik sistemdeki karşılğı

10011

şeklindedir.

Bunu üssel gösterimle ifade etmek istersek şu eşitliği de yazabiliriz.

19 = 10011 = 1.2⁴ + 0.2³ + 0.2²+ 1.2¹+ 1.2⁰

Buna göre bir noktanın 19 ile çarpımını da şu şekilde ifade etmemiz mümkün hale gelir.

19P = 2⁴P + 2¹P + 2⁰P

Oluşan eşitliğe göre Double and Add algoritması şöyle işletilir.

P noktasını al.

Bunu 2ye katla(double). Bu sayede 2P değerini elde ederiz.

2P yi P ile topla(add) Böylece 2¹P + 2⁰P değerini yakalarız.

...

Bu şekilde ikiye katlama ve toplama işlemlerinin tekrar edilmesi yoluyla sonuca ulaşabiliriz. Siz örneğin 151 sayısı için bu denkliği sağlamaya çalışarak konuyu pekiştirebilirsiniz. İpucu olarak başlangıçı veriyorum;

151 = 10010111 = 1.2⁷ + 0.2⁶ + 0.2⁵+ 1.2⁴+ 0.2³+ 1.2²+ 1.2¹+ 1.2⁰= 2⁷+ 2⁴+ 2²+ 2¹+2⁰

Bir nokta grubu için tam sayı ile çarpma işlemini ele aldığımıza göre P grubu için şöyle bir örnek yapalım.

Denklemimiz y²= x³+ 2x + 3
Sonlu alandaki toplam sayı adedi 17 (asaldır dikkat edin)
Başlangıç noktamız P(3,6)
Buna göre P'yi kendisi ile toplaya toplaya aşağıdaki dizilimi elde edebiliriz.

0P = 0
1P = (3,6)
2P = (12,2)
3P = (15,5)
4p = (14,2)
5P = (8,2)
6P = (8,15)
7P = (14,15)
8P = (15,12)
9P = (12,15)
10P = (3,11)
11P = (∞,∞)
12P = (3,6)
13P = (12,2)
14P =(15,5)
...

Bir şey dikkatinizi çekti mi? Toplamda denklemi sağlayan 22 adet (x,y) noktası söz konusu iken biz 11 elemanlı bir alt grup elde ettik ve bu grubun tekrar eden bir döngü içerisinde olduğunu görmekteyiz. Buradaki hesaplamalar için aşağıdaki örnek kod parçasını da kullanabiliriz. Fonksiyonları ve kullanım şekillerini anlamaya çalışın. İçeride bir de uzatılmış Euclid algoritması olarak isimlendirilmiş bir kısım var.

import collections

EllipticCurve = collections.namedtuple('EliptikEgri', 'name p a b g')

params = EllipticCurve(
    'y^2=x^3+ax+b', #denklem
    p=17, #toplam nokta sayisi
    a=2, #denklem a degeri
    b=3, #denklem b degeri
    g=(3,6) #generator noktasi
)

def ReverseOfMod(n, p):
    """
    n mod p isleminin tersini dondurur.
    egim hesaplamasi isleminde p1 = p2 ve p1 != p2 durumlari icin gerekli
    """
    if n == 0:
        raise ZeroDivisionError('division by zero')

    if n < 0:
        # n ** -1 = p - (-n) ** -1  (mod p)
        return p - ReverseOfMod(-n, p)

    # Uzatilmis Euclid Algoritmasi uygulanir (Extended Euclidean Algorithm)
    s, old_s = 0, 1
    t, old_t = 1, 0
    r, old_r = p, n

    while r != 0:
        d = old_r // r
        old_r, r = r, old_r - d * r
        old_s, s = s, old_s - d * s
        old_t, t = t, old_t - d * t

    gcd, x, y = old_r, old_s, old_t #gcd-greates common divisor - ebob
    return x % p

def FindNegativePoint(p):
    """
    negatif noktayi bulur
    """

    if p is None:
        return None

    x, y = p
    result = (x, -y % params.p)

    return result


def Add(p1, p2):
    """
    grup yasasindaki kriterlere gore p1+p1 islemini gerceklestirir
    """

    if p1 is None:
        # 0 + p2 = p2 durumu
        return p2
    if p2 is None:
        # p1 + 0 = p1 durumu
        return p1

    x1, y1 = p1
    x2, y2 = p2

    if x1 == x2 and y1 != y2:
        return None

    if x1 == x2:
        # p1==p2 durumu
        m = (3 * x1 * x1 + params.a) * ReverseOfMod(2 * y1, params.p)
    else:
        # p1!=p2 durumu
        m = (y1 - y2) * ReverseOfMod(x1 - x2, params.p)

    x3 = m * m - x1 - x2
    y3 = y1 + m * (x3 - x1)
    result = (x3 % params.p,-y3 % params.p)

    return result


def Multiply(n, p):
    """
    n * P islemini gerceklestirir
    """
    if n < 0:
        return Multiply(-n, FindNegativePoint(p))

    result = None
    nextP = p

    while n:
        if n & 1:
            result = Add(result, nextP)

        nextP = Add(nextP, nextP)

        n >>= 1
    return result


for i in range(0,17):
    print i,Multiply(i,(3,6))

Nokta sahası sonlu uzunlukta ve çok doğal olarak alt grup da öyle. Ancak denklem ve asal sayı değeri dikkatli seçilirse çok büyük bir grubun elde edilmesi söz konusu olabilir. Öyle ki geri çevirlemeye çalışıldığında bu inanılmaz derecede zor olur.

Bitcoin Cephesi(secp256k1)

Onlar Blockchain'in bu kriptografi kuramını göz önüne alarak aşağıdaki parametreleri içeren bir eğri tanımlamışlar.

Denklem : y²=x³+7
Sonlu alan asal sayı değeri (p) = 2²⁵⁶-2³²- 2⁹-2⁸-2⁷-2⁶- 2⁴- 1
Giriş noktası G=( 79BE667EF9DCBBAC55A06295CE870B07029BFCDB2DCE28D959F2815B16F81798, 483ADA7726A3C4655DA4FBFC0E1108A8FD17B448A68554199C47D08FFB10D4B8 )
Bir gruptaki asal nokta sayısı n = FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFEBAAEDCE6AF48A03BBFD25E8CD0364141

Dikkat edileceği üzere nokta ve asal sayı değerleri oldukça büyük. Bu da ayrık logaritma probleminin getireceği sorunun çözümünü oldukça zorlaştırır nitelikte. Her şeyden önce ortada 256bitlik bir asal sayı var. Bunun bir sonucu da en iyimser tahminle ortada 2²⁵⁶olası gizli anahtarın olması ki herhangibirini tespit edebilmek için var olanlarından mümkün olduğunca çoğunu bilmek gerekiyor. Bunu anlatmak çok zor ama trilyonlarca yıl alabilecek bir zaman ortaya çıktığı söyleniyor(Teorik olarak)

Peki yazılımcı olarak biz bu değerleri kullanarak ne yapabiliriz? Aslında seçeceğimiz bir private key değeri ile public key üretebilir sonra bu iki anahtar bilgisinden yararlanarak dijital bir imza oluşturarak belgelerimizi kriptolayabiliriz. Bu amaçla kullanılabilecek pek çok kütüphane var. Hatta şu adreste güzel bir kod örneği de bulunmakta. İnceleyip denemenizi öneririm.

Sonuç

Eliptik Eğri denklemi Blockchain ve ondan türeyen pek çok yapı tarafından asimetrik şifre üretilip transaction'ların imzalanması maksadıyla kullanılmakta. Asitmerik şifrelemede public ve private olmak üzere iki anahtar söz konusu. Public Key herkes tarafından görülebilir bir bilgi ama private key tahmin edeceğiniz üzere kişiye özel. Private key değeri kullanılarak public key değerinin elde edilmesi mümkün. Bu değeri elde ederken yukarıdaki eliptik eğri denkleminden yararlanılmakta. Ancak public key değerini kullanarak private key bilgisine oluşturmak en azından önümüzdeki birkaç milyon yüz yıl(belki de fazlası) için mümkün değil. Blockchain bir transaction'ı imzalarken private key ile oluşturulmuş bir hash değeri kullanıyor. Hash bilgisinin geriye döndürülerek private key içeriğinin bulunması zaten mümkün değil lakin public key değerine sahip olan birisi kendi ürettiği private key'leri kullanarak oluşturacağı hash'leri karşılaştırmaya çalışabilir. Lakin burada onu bekleyen şey Eliptik Eğri Dijital Kriptografi Algoritması(Elliptic Curve Digital Signature Algorithm) oluyor; ki bu konu şu an için beni aşmakta. Kaynaklar arasında daha fazla kaybolmadan hatırladığım eski matematik denklemlerimi bir kenara bırakıyor ve hepinize mutlu günler diliyerek istirahata çekiliyorum.

Kaynaklar

Blockchain 101 - Foundational Math
Blockchain 101 - Elliptic Curve Cryptography
Modulo Denklik
MathWorl - Elliptic Curve
Learn Cryptography - CryptoCurrency(51 Attack)
Johannes Bauer - ECC
Andrea Corbellini - Elliptic Cure Cryptography - A Gentle Introduction
Andrea Corbellini - Elliptic Cure Cryptography - Finite Fields and Discrete Logarithms
Implementation of Elliptic Curve Digital Signature Algorithm
Elliptic Curve Scalar Multiplaction Calculator
BitcounWiki

Floyd-Warshall Algoritması ile En Kısa Yolu Bulmak

2016-04-23T12:00:00+00:00

Merhaba Arkadaşlar,

Uzun zamandır algoritmalar üzerinde çalışmadığımı fark ettim. İşlerin biraz olsun hafiflediği şu vakitlerde de bir tanesini inceleyeyim dedim. Derken kendimi Floyd-Warshall algoritmasını anlamaya çalışırken buldum. Söz konusu algoritma Graph yapılarında boğumlar arasındaki en kısa yolların bulunmasında kullanılmaktadır.

Gerçek hayat örnekleri düşünüldüğünde Regular Expression, Network Routing, Dynamic Programming, yönsüz graph'ların iki parçalı graph'lar dönüştürülmesi ve daha bir çok alanda kullanıldığına şahit oluruz. Algoritmanın matematiksel çalışmasına bakıldığında boğumların birbirlerine olan yakınlıklarını ele alan matrisleri kullandığını görürüz.

Aslında konuyu eğlenceli olabileceğini düşündüğüm bir senaryo üzerinden ele alırsak çok daha iyi olur. Bu anlamda aşağıdaki grafiği göz önüne alalım. (Grafiğin oluşmasında Quora'nın bana çok güzel fikir verdiğini ifade etmek isterim)

Biz evimizde oturuyoruz ve örneğin Haldun Taner sahnesine gideceğiz. Normal şartlarda direkt bir güzergah kullanırsak 5 km yol gitmemiz gerekiyor. Diğer yandan önce Capitol'e, oradan Burhan Felek'e ve oradan'da Haldun Taner'e geçersek toplamda 4 km yol katediyoruz. 1 km kazancımız var bu güzergahı takip edersek. Eğer önce Burhan Felek'e oradan Haldun Taner'e geçersek de 7 km yol kat edeceğiz. Senaryoyu biraz daha geliştirelim. Diyelim ki evden Burger House'a gideceğiz. Karnımız acıkmış. Doğrudan gidersek 4 km yol almamız lazım. Farklı güzergahlar da tercih edebiliriz. Örneğin Haldun Taner üzerinden geçersek 9km, Okul üzerinden geçersek 24km yol. Bunun gibi bir yerden diğer bir yere giderken pek çok güzergah ve mesafe belirlenebilir.

İşte Floyd-Warshall algoritması bir boğumdan diğer bir boğuma gitmek için kullanılabilecek en kısa yolların çıkartılmasında devreye girerek karar vermemizi kolaylaştırır. Şimdi yukarıdaki senaryoyu biraz daha bilimsel hale getirip lokasyonlar arasındaki en kısa mesafeleri bulmaya çalışalım. Öncelikle boğumlarımıza aşağıdaki gibi numaralar verelim ve ilk olarak yakınlık matrisimizi oluşturalım. (Yakınlık matrisinin ilk versiyonu boğumların komşu boğumlar ile arasındaki mesafelerini tanımlamaktadır)

Matrisimizin ilk hali aşağıdaki gibi olacaktır.

Bu matris bize ne söylüyor acaba?

Bazı hücrelerde sonsuzluk sembolü, bazı hücrelerde ise sıfır değeri var. İki boyutlu bu matris boğumların en yakın diğer boğuma olan mesafelerini göstermekte. Bir boğumun kendisiyle arasındaki mesafe 0, doğrudan bağlı olmadığı bir boğumlar arasındaki mesafe ise sonsuz sembolü ile işaret edilmekte. Örneğin n1 boğumundan n3 ve n4 boğumlarına doğrudan bir hat olmadığı için sonsuz sembolü kullanıldı. Algoritmanın becerisi sonsuz sembollerini eritmek ve hatta sayısal değer alan hücrelerde olabilecek daha kısa mesafeler var ise bunları matris üzerinde güncellemektir.

Örneğin n1'den n3'e direkt gidişimiz olmadığından sonsuz olarak işaretlenmiş durumda. Oysa ki n1->n2->n3 şeklinde bir ulaşım var. Yani n2 üzerinden geçiş yaparak n3'e varabiliriz. Elbette n3'e varmak için n6 üzerinden de hareket edebiliriz. Yani n1->n6->n3 şeklinde bir güzergah da söz konusu olabilir. Hatta n1->n5->n4->n3 şeklinde de gidebiliriz.

İşte matrisimizi bu şekilde algoritma içerisinde işleterek nihai haline getirmemiz gerekiyor. Tahmin edeceğiniz üzere bu, çok da uğraşmak isteyeceğimiz türden bir iş değil :) Bu yüzden zaten kod yolu ile ilgili algoritmayı çalıştırmayı tercih etmekteyiz. Aşağıda algoritmanın kullanımına ilişkin bir kod parçası yer almaktadır.

using System;
using System.Linq;

namespace FloydWarshallCode
{
    class Program
    {
        static void Main(string[] args)
        {
            double[][] proximityMatrix = PrepareFirstState();
            Solve(ref proximityMatrix);
            Dump(proximityMatrix);
        }

        public static void Solve(ref double[][] matrix)
        {
            int size = matrix.Count();

            for (int i = 0; i < size; i++)
            {
                for (int j = 0; j < size; j++)
                {
                    for (int k = 0; k < size; k++)
                    {
                        matrix[j][k] = Math.Min(matrix[j][k], matrix[j][i] + matrix[i][k]);
                    }
                }
            }
        }

        private static double[][] PrepareFirstState()
        {
            double[][] matrix = new double[6][]{
                new double[6],
                new double[6],
                new double[6],
                new double[6],
                new double[6],
                new double[6]
            };

            matrix[0][0] = 0;
            matrix[0][1] = 5;
            matrix[0][2] = double.PositiveInfinity;
            matrix[0][3] = double.PositiveInfinity;
            matrix[0][4] = 16;
            matrix[0][5] = 8;

            matrix[1][0] = 5;
            matrix[1][1] = 0;
            matrix[1][2] = 1;
            matrix[1][3] = double.PositiveInfinity;
            matrix[1][4] = double.PositiveInfinity;
            matrix[1][5] = 2;

            matrix[2][0] = double.PositiveInfinity;
            matrix[2][1] = 1;
            matrix[2][2] = 0;
            matrix[2][3] = 1;
            matrix[2][4] = double.PositiveInfinity;
            matrix[2][5] = 6;

            matrix[3][0] = double.PositiveInfinity;
            matrix[3][1] = double.PositiveInfinity;
            matrix[3][2] = 1;
            matrix[3][3] = 0;
            matrix[3][4] = 4;
            matrix[3][5] = 5;

            matrix[4][0] = 16;
            matrix[4][1] = double.PositiveInfinity;
            matrix[4][2] = double.PositiveInfinity;
            matrix[4][3] = 4;
            matrix[4][4] = 0;
            matrix[4][5] = 4;

            matrix[5][0] = 8;
            matrix[5][1] = 2;
            matrix[5][2] = 6;
            matrix[5][3] = 5;
            matrix[5][4] = 4;
            matrix[5][5] = 0;

            return matrix;
        }

        public static void Dump(double[][] matrix)
        {
            int size = matrix.Count();

            for (int i = 0; i < size; i++)
            {
                for (int j = 0; j < size; j++)
                {
                    Console.Write("{0}\t", matrix[i][j]);
                }
                Console.WriteLine();
            }
        }
    }
}

Console uygulamasının 3 önemli fonksiyonu vardır. İlk olarak makalemizin başında bahsettiğimiz yakınlık matrisinin birinci versiyonunu hazırlayan basit bir metod bulunur. Pek tabii gerçek hayat senaryolarında ilgili matrisin belli bir Graph kaynağından otomatik olarak hazırlanması söz konusudur. Uygulamayı çalıştırdığımızda aşağıdaki ekran görüntüsünde yer alan sonuç matrisini elde ederiz.

Buna göre bir noktadan bir noktaya gidilebilecek en kısa mesafeler bulunmuştur. Örneğin n3 noktasından n5 noktasına gitmek istediğimizde en kısa güzergah 5km uzunluğunda olup n3->n4->n5 rotası şeklindedir. Diğer alternatif yollara bakıldığında gerçekten de en kısa mesafenin bu olduğu açıkça görülebilir.

Görüldüğü üzere Floyd-Warshal, Graph tabanlı veri kümelerinde boğumlar arası en kısa mesafelerin buluması için kullanılabilecek basit ve hızlı algoritmalardan birisidir. Konu hakkında internet üzerinden de ulaşabileceğiniz bir çok kaynak mevcut. Bunları inceleyerek algoritmayı çalışma sistematiğini anlamaya çalışmanızı öneririm. Gerçek hayat vakalarına bakılmasında da yarar olduğu kanısındayım. Böylece geldik bir makalemizin daha sonuna. Tekrardan görüşünceye dek hepinize mutlu günler dilerim.

Decimal to Binary to Hexadecimal

2014-12-21T17:00:00+00:00

Merhaba Arkadaşlar,

[İlk Draft Tarihi : 2012-08-01]

Bundan bir kaç sene önce ünlü matematikçi Fermat’ nın son teoreminin nasıl ispat edildiğinin anlatıldığı bir kitabı okumuştum. 1670 yılında ortaya çıkan ve Fermat tarafından o zaman ispat edildiği öne sürülen ama bildiğim kadarı ile kanıt bulunamayan teorem ancak 1995 yılında Andrew Wiles tarafından kanıtlanabilmiştir.

Söz konusu teoremin ispatı sırasında(bununla ilişkili olarak wikiden bilgi alabilirsiniz) arada ispat edilmek zorunda kalınan başka teoremler de ortaya çıkmıştı. Kitabın içerisinde altın orandan tutunda, Şimuya-Taniyama konjöktörünün çözümlenmesine kadar pek çok konuya yer verilmişti. Şimdi haklı olarak bunları niye söylüyorsun diyeceksiniz?

Görünen o ki evrenin hemen her alanında matematiğin izlerine rastlamaktayız. İşin gerçeği bildiğimiz tüm bilimler illaki bir ucundan da olsa matematiğe bulaşmak zorunda kalmıştır/kalmaktadır/kalacaktır. Söz gelimi bilgisayar bilimlerini göz önüne alalım. Bilgisayar bilimleri deyince işin içerisine elektronikten tutunda yazılıma kadar geniş bir alan girmektedir. Hatta kapalı ve açık devre ile başlayan ampüllerin zaman içerisinde 1 ve 0’ lar olarak anıldığı ve karşımıza anlamlı, işlenebilir veri olarak çıktığı bir durum da söz konusudur.

1 ve 0’ lar dediğimiz de ise çok basit olarak matematikteki sayı sistemlerine değinmemiz kaçınılmazdır. İkili(Binary) sayı sistemi aslına bakıldığında makinanın anlayabileceği tek kavram olarak görünmektedir. Sonuç itibariyle devrelerin çalıştığı sinyaller göz önüne alındığında open ve close durumlarının oluşması gerekir. Makinenin dip noktasından daha yukarılara doğru çıktığımızda ise karşımıza ondalık(decimal), sekizli(octal) ve hatta 16lık(Hexadecimal) sayı sistemleri çıkmaktadır. Bu sayı sistemleri arasında belirgin farklılıklar vardır elbette. Her şey byte seviyesinde düşünüldüğünde 8bitlik 1ler ve 0lar dizisine dönüşüyor olsa da, verilerin saklanması gerektiği durumlarda diğer sayı sistemleri ve özellikle hexadecimal yapı oldukça ön plana çıkabilmektedir.

İlk olarak biraz matematik diyeceğiz ve binary, decimal ile hexadecimal sayı sistemlerini göz önüne alıyor olacağız. Aşağıdaki şekilde çok basit olarak bu sayı sistemlerindeki temel değerlerin karşılıkları gösterilmektedir.

Bilindiği üzere decimal sayılar 0dan 9a kadardır. Binary sayıların sadece 1 ve 0 olduğunu biliyoruz. Diğer yandan Hexadecimal sayılar 0dan 9a kadar decimal sayılar şeklinde iken sonrasında A,B,C,D,E ve F olarak devam etmektedirler. Özellikle bir ondalıklı sayının ikili düzendeki ifadesine baktığımızda hane sayısı oldukça fazla olan rakam dizileri ile karşılaşmamız normaldir. Ancak hexadecimal düzene baktığımızda ise ondalıklı sayılara göre daha az haneden oluşan diziler söz konusu olmaktadır. Söz gelimi 100000000, 9 hanelidir ve binary karşılığı 27 rakamdan oluşmaktadır. Oysaki bu sayının hexadecimal karşılığı 7 hanedir. Hiç yoktan 2 hane 2 hanedir. Bir kum tanesi olarak düşünüldüğünde bir anlam ifade etmeyebilir ama bir kamyon dolusu kum düşünüldüğün daha büyük bir kazançta sağlayabilir

Tabi burada hane sayısının azalmasının veya fazla olmasının, makine seviyesinde bakıldığında bir anlam ifade etmediğini vurgulamamız gerekiyor. Nitekim makine seviyesinde herşey mutlak suretle 1 ve 0 olarak ifade edilmek durumundadır.

Peki matematiksel olarak bu sayı sistemleri arasındaki dönüşümler nasıl yapılabilir? Özellikle ondalıklı sistemdeki sayıların ikili düzende ifade edilmesi veya hexadecimal’ e çevrilmesi nasıl gerçekleştirilmektedir?

Burada olayı biraz kağıt kalem kullanarak ve basit bölme ve üst alma işlemleri yaparak ele almamız gerekmektedir. Örneğin 78 sayısının ikili düzendeki karşılığını bulalım ve ters dönüşümünü de sağlayalım. İşte örnek çalışma;

Yazımın kötü olmasından dolayı gerçekten çok üzgünüm. Dikkat edileceği üzere ikili sisteme dönüştürme işlemi için sayının sürekli olarak 2’ye bölünmesi ve kalan 1 ve 0 ların ters sırada birleştirilmesi söz konusudur. İkili sayı sisteminde ifade edilen rakamların, ondalık sisteme dönüştürülmesinde ise, 2üzeri0 dan başlayaraktan 2nin katları ile 1 ve 0ların çarpımı sonucu elde edilen ifadelerin toplanması söz konusudur.

Peki 78 sayısının hexadecimal karşılığı nasıl bulunabilir? ve tabi hexadecimal bir sayının ondalık sistemdeki karşılığı nasıl hesaplanır? Yine kağıt kaleme sarılırsak işlemin çok daha basit olduğunu görebiliriz.

Görüldüğü üzere bir ondalıklı sayının ikili sisteme dönüştürülmesindeki felsefenin aynısı burada da geçerlidir. Tek yapılması gereken 16ya bölme ve kalanları değerlendirmedir. Tabi kalanarın 1 ve 0 değil, 0 ile 15 aralığında olması önemlidir. 9dan sonraki rakamlarda(10,11,12,13,14,15) sırasıyla A,B,C,D,E ve F harflerine yer verilmektedir. Bir hexadecimal ifadenin ondalıklı sayıya çevrilmesinde ise 16üzeri0 ile başlayan katlı sistem devreye girer. İlgili katlar sayının veya harfin karşılık geldiği(örneğin Enin karşılığı olan 12) değer ile çarpılır ve genel toplam alınarak ondalık sayı karşılığı bulunur.

Teorem bu kadar basit olduğuna göre bir sayının ikili veya 16lı sayı sistemine çevrilmesi için gerekli kodları geliştirebilirsiniz. Bu iyi bir antrenman olacaktır Ama çok da şart değildir. Nitekim Convert tipinin ilgili static metodları base parametresi ile ilgili dönüşümlere izin vermektedir. Aşağıdaki örnek kod parçasını bu anlamda göz önüne alabiliriz.

using System;

namespace NumberSystems 
{ 
    class Program 
    { 
        static void Main(string[] args) 
        { 
            int number1 = 78; 
            string number1Binary = Convert.ToString(number1, 2); 
            string number1Hexadecimal = Convert.ToString(number1, 16);

            Console.WriteLine("Decimal to Binary/Hexadecimal\n{0}\t=\t{1}\n{2}\t=\t{3}\n" 
                ,number1 
                ,number1Binary 
                ,number1 
                ,number1Hexadecimal 
                );

            int number2 = Convert.ToInt32(number1Binary, 2); 
            int number3 = Convert.ToInt32(number1Hexadecimal, 16);

            Console.WriteLine("Binary/Hexadecimal to Decimal\n{0}\t=\t{1}\n{2}\t=\t{3}\n" 
                , number1Binary 
                , number2 
                , number1Hexadecimal 
                , number3 
                ); 
        } 
    } 
}

Convert tipinin static ToString ve ToInt32 metodlarına verilen ikinci parametrelere dikkat edelim. Bu parametreler ile sayısal taban belirtilmektedir. Binary düzen için 2, Hexadecimal düzen için ise 16. Kodun çalışma zamanı çıktısı ise aşağıdaki gibi olacaktır.

Şimdi olayı biraz daha ilginç bir hale getirelim ne dersiniz? Önce örnek kodumuz…

using System; 
using System.Collections.Generic; 
using System.IO; 
using System.Text;

namespace NumberSystems 
{ 
    class Program 
    { 
        static void Main(string[] args) 
        { 
            string fileDecimal = Path.Combine(Environment.CurrentDirectory, "Decimal.txt"); 
            string fileBinary = Path.Combine(Environment.CurrentDirectory, "Binary.txt"); 
            string fileHexadecimal = Path.Combine(Environment.CurrentDirectory, "Hexadecimal.txt");

            List<int> numbers = GetRandomNumbers(100000000, 900000000, 1000000);

            WriteToFile(fileDecimal, numbers, BaseType.Decimal); 
            WriteToFile(fileBinary, numbers, BaseType.Binary); 
            WriteToFile(fileHexadecimal, numbers, BaseType.Hexadecimal); 
        }

        private static List<int> GetRandomNumbers(int initialValue, int lastValue, int arrayLength) 
        { 
            List<int> numbers = new List<int>();

            Random random = new Random(); 
            for (int i = 0; i < arrayLength; i++) 
            { 
                numbers.Add(random.Next(initialValue, lastValue)); 
            }

            return numbers; 
        } 
        private static void WriteToFile(string fileName, List<int> numbers, BaseType baseType) 
        { 
            StringBuilder builder = new StringBuilder();

            for (int i = 0; i < numbers.Count; i++) 
            { 
                builder.AppendLine(Convert.ToString(numbers[i], (int)baseType)); 
            }

            File.WriteAllText(fileName, builder.ToString()); 
        } 
    }

    public enum BaseType 
    { 
        Binary = 2, 
        Decimal = 10, 
        Hexadecimal = 16 
    } 
}

Öncelikle bu kod parçasında ne yaptığımıza bir bakalım.

GetRandomNumbers isimli metodumuz belirtilen integer değer aralığında bizim belirttiğimiz sayıda rastege sayı üretmekte ve bunları generic bir List<int> koleksiyonu içerisinde geriye döndürmektedir. WriteToFile isimli metodumuz ise bu rastgele sayı listesini alıp fiziki bir text dosyasına kayıt etmektedir. WriteToFile metodunun üçüncü parametresi BaseType enum sabiti tipindendir. Bu sabite dikkat edecek olursak Binary, Decimal ve Hexadecimal sayı tabanı sistemlerini işaret edecek şekilde oluşturulmuştur. İlgili Enum sabitinin sayısal değeri, Convert.ToString metodunun ikinci parametresi olarak kullanılmaktadır. Main metodu içerisinde yazdığımız test kodları, ondalıklı sayıların decimal, binary ve hexadecimal düzende tutulduğu text dosyalarının üretimini üstlenmektedir. Kodun yazılış biçiminden ziyade, kullanılan senaryo gereği üretilen dosya boyutlarının ne olduğu daha çok önemlidir. İşte bu denemenin sonuçları.

Mutlaka dikkatinizi çekmiştir ki, Binary dosya boyutu 30 megabyte ile haklı bir liderliği üstlenmektedir Her ne kadar Decimal ile Hexadecimal arasında çok büyük bir fark olmadığı gözüksede, sayı dizisinin boyutunun arttırılması halinde durum biraz daha farklılık gösterebilmektedir. Bu amaçla test sonuçlarını biraz daha sağlıklı irdelemek adına kodumuzu biraz daha değiştirelim.

using System; 
using System.Collections.Generic; 
using System.Diagnostics; 
using System.IO; 
using System.Text;

namespace NumberSystems 
{ 
    class Program 
    { 
        static void Main(string[] args) 
        { 
            string fileDecimal = Path.Combine(Environment.CurrentDirectory, "Decimal.txt"); 
            string fileBinary = Path.Combine(Environment.CurrentDirectory, "Binary.txt"); 
            string fileHexadecimal = Path.Combine(Environment.CurrentDirectory, "Hexadecimal.txt");

            for (int i = 5; i < 9; i++) 
            { 
                int length = (int)Math.Pow(10, i); 
                Console.WriteLine(length); 
                List<int> numbers = GetRandomNumbers(10000000, 90000000, length); 
                WriteToFile(fileDecimal, numbers, BaseType.Decimal); 
                WriteToFile(fileBinary, numbers, BaseType.Binary); 
                WriteToFile(fileHexadecimal, numbers, BaseType.Hexadecimal); 
                Console.WriteLine("---"); 
            } 
        }

        private static List<int> GetRandomNumbers(int initialValue, int lastValue, int arrayLength) 
        { 
            List<int> numbers = new List<int>();

            Random random = new Random(); 
            for (int i = 0; i < arrayLength; i++) 
            { 
                numbers.Add(random.Next(initialValue, lastValue)); 
            }

            return numbers; 
        } 
        private static void WriteToFile(string fileName, List<int> numbers, BaseType baseType) 
        { 
            StringBuilder builder = new StringBuilder(); 
            Stopwatch watcher = new Stopwatch();

            for (int i = 0; i < numbers.Count; i++) 
            { 
                builder.AppendLine(Convert.ToString(numbers[i], (int)baseType)); 
            }

            watcher.Start(); 
            File.WriteAllText(fileName, builder.ToString()); 
            watcher.Stop(); 
            FileInfo fi=new FileInfo(fileName); 
            Console.WriteLine( 
                "{0}\tSize:{1}\tProcess Time:{2}" 
                ,Path.GetFileName(fileName) 
                ,fi.Length.ToString() 
                ,watcher.ElapsedMilliseconds.ToString() 
                ); 
        } 
    }

    public enum BaseType 
    { 
        Binary = 2, 
        Decimal = 10, 
        Hexadecimal = 16 
    } 
}

Bu sefer 10un katları şeklinde arka arkaya denemeler yapıyoruz. Her denemede binary, decimal ve hexadecimal dosyalardan birer tane üretmekteyiz. Sonuçları daha sağlıklı irdelemek adınaysa ekrana üretilen dosyanın adını, boyutunu, test için kullanılan eleman sayısını ve son olarakta yazma işlemi sırasında geçen süreleri çıkartmaktayız. Her test sırasında farklı sayılar ile çalışılıyor olasa teste tabi tutulan eleman sayısı belirleyici kriter olduğundan bu durumu göz ardı edebiliriz. Uygulamanın çalışma zamanındaki çıktısı aşağıdaki gibi olacaktır.

Tabi söz konusu istatistikleri Excel üzerine grafik haline getirdiğimizde durumu biraz daha net bir biçimde analiz edebiliriz. İlk olarak üretilen dosya boyutlarına bir bakalım.

İlk başlarda çok fazla fark görülmüyor olsa da, eleman sayısının çok daha fazlalaştırılması halinde özellikle binary düzende saklanan veri kümesinin toplam boyutunun belirgin ölçüde yükseldiği gözlenmekte. Dosyalara yazma sürelerine ait istatistikler de aşağıdaki gibi özetlenebilir.

Aslında en hızlı üretim biçimi decimal içerikli dosyalarda söz konusudur. Ancak hız ve boyut kriterlerine baktığımızda Hexadecimal olarak veriyi saklamanın daha uygun olduğu sonucuna varılabilir. Tabi şu durum da gözden kaçırılmamlıdır. Decimal içerikleri Hexadecimal olarak saklamak ve bu saklanan içeriği tekrardan decimal olarak göstermek istediğimizde yazma ve okuma işlemleri yapılması gerektiği ve bunlar için uygulamaya ek süreler yükleneceği de ortadadır. Yine de bazı bilimsel ve matematiksel uygulamalarda, çok büyük boyutlu decimal içeriklerin fiziki olarak saklanması gerektiği durumda Hexadecimal çevirmeler düşünülebilir. Böylece geldik bir yazımızın daha sonuna. Tekrardan görüşünceye dek hepinize mutlu günler dilerim.

NumberSystems.zip (25,96 kb)

Recursive Fibonacci Neden Yavaş?

2013-06-07T00:40:00+00:00

Merhaba Arkadaşlar,

Okulda “Algoritma ve Veri Yapıları” dersinde ya da C# benzeri nesne yönelimli(Object Oriented) bir dili öğrenmeye başladığımız ilk zamanlarda, karşımıza muhakkak Recursive fonksiyonlar çıkmıştır(Çıkmaya da devam edecektir). Hatta en meşhur olanları da, bir sayının faktöryelinin (6!=6x5x4x3x2x1=720 ve 0!=1) bulunması veya Fibonacci sayı dizisinin(0,1,1,2,3,5,8,13,21,34…, Fn=(Fn-1(+(Fn-2)) ardışıl olarak ekrana yazdırılmasıdır.

Recursive fonksiyonları ilk etapta anlamakta güçlük çeksek de, matematik ile bağdaşdırmakta zorlansak da, pek çok noktada hayat kurtaran ve gerekli olan metodlar olduklarını biliriz. Örneğin strateji oyunlarında, ikili(Binary) ağaç aramalarında, doğal dil işleme metodolojilerinde, Hanoi kuleleri gibi popüler problemlerin çözümünde ve daha pek çok yerde Recursive fonksiyonellikler söz konusudur.

Biz bu görsel dersimizde, Fibonacci sayı dizisinin Recursive fonksiyonlar ile elde edilmesi halinde sistemin neden ve nasıl yavaşladığını anlamaya çalıştık. Ardından da iteratif bir yaklaşım üzerinde durarak basit bir çıkarımda bulunduk.

Faydalı olması dileğiyle

Levenshtein Distance Algoritması

2012-07-01T23:05:00+00:00

Merhaba Arkadaşlar,

Bir süredir yazılım dünyasında sıklıkla kullanılan basit algoritmalara merak salmış durumdayım. Bazıları kafayı yedirtecek cinsten olsalarda arada sırada bunları değerlendirmekte ve paslanan dimamızı açmaya çalışmakta yarar olduğu kanısındayım.

Aslına bakarsanız bilgisayar bilimlerinde uygulanabilen, gerçekten çok işe yarayan ve onları keşfedenleri saygıyla hatırlamamız gereken algoritmalar mevcut. Örneğin bunlardan birisi olan Levenshtein Distance algoritması ve mucidi Vladimir Levenshtein

Bu algoritma bizlere, özellikle arama motorlarında da kullanılabilen bir model sunmaktadır. Son kullanıcıların aradıkları kelimeleri tam olarak belirleyemedikleri veya kestiremedikleri durumlarda, öneri olarak sunulan kelimelerin tespit edilmesi sırasında ele alınan bir algoritmadır. Örneğin ben Google sitesindeki arama kutucuğunda kendi ismimi eksik karakterler ile yazdığımda, google daha önceden yapmış olduğu indekslenmiş içeriklere göre bir öneri de bulunmuştur(Bunu mu demek istediniz kısmı) Aşağıdaki şekilde bu durum açık bir şekilde görülmektedir.

Arama motorları dışında, özellikle imla kontrolü yapan uygulamalarda da(Söz gelimi Microsoft Outlook veya Microsoft Word’ ün Spell Checking mekanizmalarında) bu algoritmanın kullanımına sıklıkla şahit olmaktayız.

Biz bu yazımızda söz konusu algoritmanın kullanılması için gerekli olan temel fonksiyonu, sıklıkla yaptığımız üzere bir Extension Method olarak geliştirmeye ve test etmeye çalışıyor olacağız. Ancak kodlama kısmına geçmeden önce algoritmanın nasıl çalıştığına ve işlediğine bakmamızda yarar olacağı kanısındayım.

Aslında algoritma temel olarak iki kelimenin birbirlerine olan benzerliklerini ölçümlemek amacıyla kullanılmaktadır. Sonuç tek bir sayısal değerdir ve iki kelimeden birinin diğerine dönüştürülebilmesi için gerekli olan işlem sayısını ya da maliyetini vermektedir. Çok doğal olarak bu sayınının düşük olması arzu edilen neticedir. Nitekim daha az değişiklik anlamına gelmektedir. Çok doğal olarak bir kelimenin, bir öneri kelime kümesi içerisindekiler ile karşılaştırılması sonucu ortaya çıkan sayısal değerlerden en küçüğü veya küçükleri, sonuca ulaşılması ve doğru önerilerde bulunulması açısından önemlidir.

Peki bu yakınlık değeri nasıl hesaplanmaktadır? Bunun için kelimeler arası iki boyutlu bir matris dizisi kullanılır. Lakin söz konusu matrisin içereceği değerlerin tespiti çok da kolay değildir. Dilerseniz aşağıdaki Excel görüntüsünde yer alan örneklemelere bir bakalım ve algoritmayı daha yakından tanımaya çalışalım.

Bu grafikte, 5 farklı örnek ile 10 kelimenin birbirleri ile yakınlıklarının Levensthein Distance algoritmasına göre nasıl hesap edildiği gösterilmektedir. İlk olarak rest kelimesinin test kelimesi ile olan yakınlığı bulunmaya çalışılmıştır. Aslına bakarsanız bu iki kelime arasında sadece 1 işlem yaparak sonuca ulaşılabilir. Bu işleme göre rest kelimesindeki r harfi yerine, t harfinin gelmesi yeterlidir. Matris içerisinde yer alan sayılar o andaki sütuna veya satıra kadar olan harf topluluklarının birbirleri ile eş düşmeleri için gerekli işlem sayılarını içermektedir.

Şimdi de google ve yahoo! kelimelerinin yakınlık hesabını göz önüne alalım. Normal şartlarda iki kelime içerisinde ortak olan 2 “o” harfi bulunmaktadır ancak yerleri farklıdır. Diğer harfler ise zaten birbirlerinde yoktur. Bu nedenle 6 işlemlik bir operasyon yapılması gerekmektedir.

Peki sayılar tam olarak nasıl yerleştirilmekte veya okunmaktadırlar? Hemen Samantha ile Sam’ in karşılaştırılmasını ele alalım. Şimdi 0 indisli olacak şekilde 1nci sütun ve 1inci satırı göz önüne alalım. 1nci sütunda “s” harfi ve 1nci satırda yine “s” harfi bulunmaktadır. Dolayısıyla o anki karşılaştırmada, her iki harfte aynı olduğunda bir işlem yapılmasına gerek yoktur. Dolayısıyla işlem maliyeti 0dır. Şimdi 2ncü sütuna ve 1nci satıra bakalım. 2nci sütuna kadar olan kısımda “sa“ hecesi oluşmuştur. Satır tarafında ise sadece “s” harfi bulunmaktadır. Dolayısıyla eşleştirme için satır kısmındaki “s” harfine bir de “a” harfinin eklenmiş olması gerekir. Ki bu da 1 işlem maliyeti olarak ifade edilmektedir.

Durumu biraz daha öteleyelim. 5 numaralı örnekte yer alan puzzle ve pzzel kelimelerinin karşılaştırılmasında 5nci sütun ve 4ncü satıra bakalım. 5nci sütuna kadar puzz kelimesi 4ncü satıra kadar da pzz kelimesi söz konusudur.pzz’ un puzz kelimesine benzemesi için araya bir “u” harfinin konulması yeterlidir. Diğer kısımlar satır ve sütun bazında da eşleşmektedir. Bu yüzden buradaki işlem maliyeti değeri 1 dir. Ancak yine 0 indisli baktığımızda ve 7nci sütun ve 6ncı satıra kadar olan kısımda puzzle ve pzzel kelimeleri göz önüne alındığında ise; pzzel’ dan puzzle’a geçmek istenildiğinde ilk olarak araya bir “u” harfi konulur.

p^uzzel

Ardından “el” hecesinde e’ nin l yerine, l’ nin e yerine geçmesi gerekir.

p^uzz^le

Dolayısıyla toplamda 3 işlem maliyeti söz konusu olmuştur.

Bu algoritma gereği iki kelime arasındaki yakınlık derecesi, matrisin sağ alt hücresindeki sayısal değer ile ifade edilmektedir. Buna göre puzzle ile pzzel kelimeleri arasındaki mesafe 3 işlem operayonu ile ölçülürken, bu Samantha ve Sam kelimeleri arasında 5 işlemlik bir maliyet oluşması söz konusudur(Samantha’ dan antha kısmının atılması nedeni ile 5 işlemlik bir maliyet oluşmaktadır)

Algoritmayı biraz kavradığımıza göre dilerseniz bunu C# tarafında bir Extension Method içerisine dahil edelim ve test uygulamamıza çıkalım. Bu amaçla aşağıdaki örnek Console uygulamasını göz önüne alabiliriz.

using System;

namespace UsingLevenshtein 
{ 
    class Program 
    { 
        static void Main(string[] args) 
        { 
            TestMethod("rest", "test"); 
            TestMethod("google", "yahoo!"); 
            TestMethod("mike", "mayk"); 
            TestMethod("samantha", "sam"); 
            TestMethod("puzzle", "pzzel"); 
        }

        private static void TestMethod(string Source,string Target) 
        { 
            int[,] matrix3 = new int[Source.Length, Target.Length]; 
            int distance3 = Source.FindLevenshteinDistance(Target, out matrix3); 
            Console.WriteLine("{0} vs {1}\nDistance : {2}\n",Source,Target, distance3); 
            WriteToConsole(matrix3); 
        } 
        static void WriteToConsole(int[,] Matrix) 
        { 
            for (int i = 0; i < Matrix.GetLength(0); i++) 
            { 
                for (int j = 0; j < Matrix.GetLength(1); j++) 
                { 
                    Console.Write("\t{0}  ", Matrix[i, j]); 
                } 
                Console.WriteLine(); 
            } 
            Console.WriteLine(); 
        } 
    }

    public static class StringExtensions 
    { 
        // Genişletme metodu, karşılaştırma matrisini de out parametresi olarak döndürmektedir. 
        public static int FindLevenshteinDistance(this string Source, string Target,out int[,] Matrix) 
        { 
            int n = Source.Length; 
            int m = Target.Length;

            Matrix = new int[n + 1, m + 1]; // Hesaplama matrisi üretilir. 2 boyutlu matrisin boyut uzunlukları ise kaynak ve hedef metinlerin karakter uzunluklarına göre set edilir

            if (n == 0) // Eğer kaynak metin yoksa zaten hedef metnin tüm harflerinin değişimi söz konusu olduğundan, hedef metnin uzunluğu kadar bir yakınlık değeri mümkün olabilir 
                return m;

            if (m == 0) // Yukarıdaki durum hedefin karakter içermemesi halinde de geçerlidir 
                return n;

            // Aşağıdaki iki döngü ile yatay ve düşey eksenlerdeki standart 0,1,2,3,4...n elemanları doldurulur 
            for (int i = 0; i <= n;i++) 
                Matrix[i, 0] = i; 
            
            for (int j = 0; j <= m; j++) 
                Matrix[0, j] = j;

            // Kıyaslama ve derecelendirme operasyonu yapılır 
            for (int i = 1; i <= n; i++) 
                for (int j = 1; j <= m; j++) 
                { 
                    int cost = (Target[j - 1] == Source[i - 1]) ? 0 : 1; 
                    Matrix[i, j] = Math.Min(Math.Min(Matrix[i - 1, j] + 1, Matrix[i, j - 1] + 1), Matrix[i - 1, j - 1] + cost); 
                }

           return Matrix[n, m]; // sağ alt taraftaki hücre değeri döndürülür 
        }        
    } 
}

Uygulamamız içerisinde dikkat edeceğiniz üzere Excel tablosunda yer alan kelimelere ait bir test işlemi gerçekleştirilmektedir.FindLevenshteinDistance isimli metodumuz bir genişletme fonksiyonu olarak herhangibir string tipine uygulanabilecek şekilde tasarlanmıştır. Bununla birlikte söz konusu metod hem Levenshtein Distance matrisini, hemde yakınlık derecesini döndürmektedir. Uygulama içerisinde kelimeler arası testi kolaylaştırmak adına TestMethod isimli bir fonksiyon da ele alınmıştır. Programın çalışma zamanındaki çıktısı ise aşağıdaki gibi olacaktır.

Artık bundan sonrasında yapılması gereken, bir text kutucuğuna girilen metni, bir metin kümesi içerisinde söz konusu algoritmaya göre aramak ve yakınlık derecesi, bir başka deyişle operasyon işlem maliyeti en düşük olan kelime veya kelimeleri kullanıcıya sunmaya çalışmaktan ibarettir. Dilerseniz bu konuyu bir düşünün ve uygulamaya çalışın Tekrardan görüşünceye dek hepinize mutlu günler dilerim.

UsingLevenshtein.zip (15,85 kb)