Düzenli İfadeler-3

Yazar: Unknown Tarih: 11 Eylül 2012 Salı Yorum: (0)
+(Artı)

Bu karakterimiz * karakteriyle benzerdir.Fakat * karakteriyle kendisinden önceki 0 veya daha fazla
sayıda tekrar eden karakterleri buluyor.+ işareti ise kendisinden önce 1 veya daha fazla olan
karakterleri bulamamızı sağlıyor.

Örnek:

>>> liste=["batman", "catwoman", "zorman", "man"]

>>> for i in liste:
if re.match(".+man",i):
print i

batman
catwoman
zorman

Görüğümüz gibi burada "man" kelimesinin çıktısını vermedi.Bunun neden ".+man" yazmış olmamızdır.
Ama * karakteriyle kullanılan sonuçta ise;

>>> for i in liste:
if re.match(".*man",i):
print i


batman
catwoman
zorman
man

"man" kelimesini ekrana verdi.


Şimdi bu +(Artı) karakterimizle ilgili biraz örnekler verelim:


*(Yıldız) Karakteriyle
>>> liste=["dv","dev","deev","deeeev","deveeeee"]
>>> for i in liste:
if re.match("de*v",i):
print i


dv
dev
deev
deeeev
deveeeee


+(Artı) Karakteriyle
>>> for i in liste:
if re.match("de+v",i):
print i


dev
deev
deeeev
deveeeee


?(Soru İşareti) 

Bu karakterimiz *(Yıldız) ve +(Artı) işaretinin birleşimi şeklinde belirtebiliriz.
Hemen örnekleyelim:

*(Yıldız) Karakteriyle
>>> liste=["dv","dev","deev","deeeev","deveeeee"]
>>> for i in liste:
if re.match("de*v",i):
print i


dv
dev
deev
deeeev
deveeeee


+(Artı) Karakteriyle
>>> for i in liste:
if re.match("de+v",i):
print i


dev
deev
deeeev
deveeeee

?(Soru İşareti) Karakteriyle
>>> for i in liste:
if re.match("de?v",i):
print i


dv
dev
deveeeee

Gördüğümüz gibi ?(Soru İşareti) Karakteri d ile v arasındaki e karakterinden hiç geçmeyen kelimeleri ve 1 defa geçen kelimeleri buldu.

Pythonla IP adresimizi öğrenelim

Yazar: Unknown Tarih: Yorum: (0)
# -*- coding: utf-8 -*-
import urllib2
import socket

url="http://droidpark.com/whatismyip/"

hostname=socket.gethostname()

lanip=socket.gethostbyname(socket.gethostname())

try:
adresiAl=urllib2.urlopen(url)
wanip=adresiAl.read()
adresiAl.close()
except IOError:
print "Şuanda ip adresiniz alamıyoruz";
wanip="Error!";

print "*"*10;
print "Makine adi : %s" % hostname
print "WAN IP Adresi : %s" % wanip
print "LAN IP Adresi : %s" % lanip
print "*"*10


Kaynak

Düzenli İfadeler -2-

Yazar: Unknown Tarih: 19 Şubat 2012 Pazar Yorum: 2
Metakarakterler
Bu başlık altında python'da metakarakter olarak adlandırılan []  .  *  +  ?  {}  ^  $  |  ()  \
bu karakterleri göreceğiz.Giriş olarak kısa bir örnek yapalım

>>> import re
>>> liste=["turgay","turgut","özkan","özcan","özhan","kemal","dündar"]
>>> for i in liste:
    nesne=re.search("öz[chk]an",i)
    if nesne:
        print (nesne.group())

özkan
özcan
özhan

şeklinde bir örnek ile [] işareti ile belli bir harf aralıklarını içeren isimleri bulduk.Şimdi
bun karakterlerini işleyelim.

[] Köşeli Parantez
Giriş kısmındada bağsettiğimiz gibi belli bir karakteri yada belli bir aralığı araştırır.

Şimdi önceki yazımda anlattığım match metoduyla bir örnek yapalım...

>>> import re
>>> x=["1php","2python","perl","java","3jquery","4css","c/c++"]
>>> for y in x:
    if re.match("[0-9]",y):
        print (y)

1php
2python
3jquery
4css

yaptığımız örnek,sayı ile başlayan karakter dizilerini match metoduyla bulmak.
Eğer istersek if re.match("[0-9]",y): ifadesini if re.match("[A-Z]",y): şeklinde değiştirerek
har ile başlayan karakter dizilerini ekrana yazdırabiliriz.Ama tabi bu büyük hat aramsı yapacağı için
bizim örneğimizde çalışacak şekli if re.match("[a-z]",y): şeklindedir.

. Nokta
Bu metakarakteri yeni satır karakteri dışındaki karakterlerin yerini tutar.

>>>liste=['sema', 'sena', 'sefa', 'semra', 'sene']
>>> for i in liste:
    if re.match("se.a",i):
        print(i)

sema
sena
sefa

yukarıdaki örnek bir dizi oluşturup,dizi için de "se" ile başlayıp "a" ile biteni veya devam edeni
bulmasını istedik.Burada .nokta m,n,f karakterlerinin yerini tutarak işlemi gerçekleştirdi.
Eğer şöyle bir örnek yaparsanız

>>> liste=["ahmet","mehmet","samet",]
>>> for i in liste:
    if re.match(".met",i):
        print(i)

şeklindeki örnek hiç bir çıktı vermeyecek.Çünkü ilk örnektede olduğu gibi bu metakarakter tek
karakterin yerini tutar.

* Yıldız
Bu metakarakter, kendisinden önce gelen bir ifade kalıbını 0 veya daha fazla karakterde eşleştirir.
Yani .nokta karakterinin çoğulu gibi düşünebiliriz.

>>> liste=["at","sat","saat","kat","tat","strafor"]
>>> liste.append("strafor")
>>> for i in liste:
    if re.match("sa*t",i):
        print (i)

sat
saat
strafor

Bu örnekte yaptığımızı açıklamak gerekirse,s ile başlayan karakter dizilerini bulmak diyebiliriz.
Burada s ile başlayıp a ile devam eden karakter dizilerini buldu.Ama strafor ne alaka diyebilirsiniz.
Tanımda da dediğimiz gibi 0 veya daha fazla eşleştirme yapar.

Düzenli İfadeler / Regular Experessions

Yazar: Unknown Tarih: 16 Şubat 2012 Perşembe Yorum: (0)
Evet yeni bir konuya geçiş yapıyoruz.
Düzenli ifadeler her programlama dilinde oluduğu gibi pythonda da karşımıza çıkıyor.
Ama söylemeliyim ki python'nun belkide en karmaşık konusu.Ama elimden geldiğince basite indirgeyip
anlatmaya çalışacağım.Bu kadar konuşmadan sonra başlayalım...

Başlangıç olarak  re modülünü programa çağırmamız gerekiyor ki daha öncede yaptığımız gibi

>>>import re

Bunun arkasından dir(re) komutu ile kullanacağımız metodları ekrana yazdırabiliriz.
Gördüğünüz gibi biraz fazla.Tabiki hepsini anlatmayacağım ama bu anlatmayacaklarımın işinize
yaramayacağı anlamına gelmez.

Match() Metodu
Bu metod daha önce işlediğimiz split() ve startswith() metodlarıyla aynı işlevdedir.
Görevi ise bir karakter dizisi içinde bir kelime aramamızı sağlar fakat aradığımız kelime karakter
dizisinin başında olması gerekir.

>>> x="python dilini öğreniyorum"
>>> re.match("python",x)
<_sre.SRE_Match object at 0x0000000002D7C5E0>

Gördüğümüz gibi burada python kelimesi karakter dizimiz içinde var fakat python'nun bize döndürdüğü
mesaj pekde anlaşılır değil ama aradığımız kelimenin karakter dizisinin içinde varolduğunu söylüyor

Ama şunu yazarsak

>>> re.match("dilini",x)

herhangi bir çıktı ekrana gelmeyecektir.Aslında gelecektir fakat bunu görmek için kodun başına sadece
print ifadesini eklemek yeterli olacaktır.Peki karakter dizimizde "dilini" kelimesi var neden mesaj
vermedi derseniz match metdounun açıklama kısmının son cümlesine bakmanızı tavsiye ederim.

Split ve startswith ile aynı işlevde demiştik

>>> a.split()[0]=="python"
True
>>> a.split()[0]=="dilini"
False

>>> a.startswith("python")
True
>>> a.startswith("dilini")
False

Eğer amaç karakter dizisi başında bulunan bir kelimeyi bulmaksa Split ve startswith metodları kullanılmalıdır.
Çünkü Split ve startswith, match metodundan daha hızlıdırlar.

>>> y="abcdefg"
>>> re.match("abc")
<_sre.SRE_Match object at 0x0000000002E8C5E0>

>>> re.match("abcdef",y)
<_sre.SRE_Match object at 0x0000000002E8C648>

print (re.match("abcg",y))
none

Ama sitersek arattığımızda ne bulunduğunu da görebiliriz

>>> re.match("abcg",y)
>>> a="django,pythonnun çatısıdır"
>>> b=re.match("django",a)
>>> b.group()
'django'

Evet hemen bir programa yazalım

import re
x=input("Bir kelime giriniz: ")
y=re.match("python",x)
if y:
    print ("Kelimeniz (",y.group(),")ile başlıyor")
else:
    print ("Kelimeniz python ile başlamıyor")

bu programı yazıp masaüstünüze kaydedip deneyin ve siz de daha farklı programlar yazmayı deneyin ki
bu dersler dersler bir işe yarasın :)

Search() Metodu
Bu metod ile de karakter dizimizin tamammında arama yapabiliriz

>>>a="python dilinde en karışık konu düzenli ifadeler."
>>>re.search("ifadeler",a)
<_sre.SRE_Match object at 0x0000000002E2C648>

Bu kodla ilgili bir program yazarsak

import re
x=input("Bir cümle giriniz: ")
y=re.search("http://www.",x)
if y:
    print("cümlenizde internet adresi bulundu")
else:
    print("cümlenizde herhengi bir internet adresi yok")

Findall() Metodu
Bu metod ise yine search metodunun yaptığı işi yapar,ayrıca kelimenin karakter dizisi içinde
kaç tane olduğunu biz gösterir.

>>> import re
>>> z="Python'un son derece kolay okunabilir olması düşünülmüştür. Bu yüzden örneğin küme parantezleri yerine girintileme işlemi kullanılır. Hatta bazı durumlarda girintileme işlemine dahi gerek kalmadan kodun ilgili bölümü tek satırda yazılabilir. Böylece Python, program kodunuzu en az çaba ile ve hızlıca yazmanıza imkân tanır. Sade sözdizimi ile diğer programlama dillerinden üstündür."
>>> re.findall("python",z)
['Python', 'Python']

>>> c="Python programalama diline başlayalı çok olmadıki,pythonu sevmeye başladım"
>>> re.findall("python",c)
['python']

Yukarıda 2 tane örnek verdim.Fakat bunların ikisindede 2 tane python yazısı olamsına rağmen
birincisinde 2 tane python yazısı bul ikincisinde ise 1 tane.Bunun nedeni ise findall aranınlan
kelimeye tam olarak uyanı arar ve büyük küçük harf farkı bunu etkiler.

Karakter Dizi Metodları-4

Yazar: Unknown Tarih: 3 Şubat 2012 Cuma Yorum: (0)
Partition metodu
Bu metod ile bir karakter dizisini belli bir ölçüte göre ayırabiliriz.

>>> a="bartın"
>>> a.partition("rt")
('ba', 'rt', 'ın')

>>> a.partition("b")
('', 'b', 'artın')

Eğer aratacağımız karakter, bizim karakter dizimiz içinde yok ise

>>> a.partition("P")
('bartın', '', '')

RPartition metodu
Partition metodu ile aynı görevde olup tek farkı Partition metodu soldan sağa RPartition metodu
ise sağdan sola doğru okuma yapar.

>>> a.rpartition("n")
('bartı', 'n', '')

Strip Metodu
Bu metod ise karakter dizimizin başında ve sonunda yer alan boşluk ve yeni satır gibi karakterleri
kaldırır.

>>> b="   Yönetim Bilişim Sistemleri   "
>>> b.strip()
'Yönetim Bilişim Sistemleri'

RStrip Metodu
Bu metod ise strip metodunun sağdece sonuna yani sağındaki boşluk ve yeni satır karakterleri kaldırır.

>>> b.rstrip()
'   Yönetim Bilişim Sistemleri'

LStrip Metodu
Bu metodda karakter dizimizin başında yani solundaki boşluk ve yeni satır karakterleri kaldırır.

>>> b.lstrip()
'Yönetim Bilişim Sistemleri   '

Splitlines Metodu
Bu metod ile karakter dizimizde yeni satır noktalarından itibaren keserek, bunları bir liste
haline çevirebilmemizi sağlıyor.

>>> c="Yönetim\nBilişim\nSistemleri"
>>> c.splitlines()
['Yönetim', 'Bilişim', 'Sistemleri']

Split Metodu
Bu metod join() metoduna benzemektedir.join() metoduyla bir listenin öğelerini karakter dizisi
şekline çeviriyorduk.Split() ie bu işlemin tam tersini yapıyor.

>>> f="Python programlama dili"
>>> f.split()
['Python', 'programlama', 'dili']

Bu şekilde ayırabildiği gibi

>>> f.split(",")
['Python programlama dili']

şeklindede birleştirebilir.
Diğer bir özelliği ise bir karakter dizisini kaç kez kesme işleminin uygulanmasını belirlememiz

>>> site="wwww.pythondili.blogspot.com"
>>> site.split(".",2)
['wwww', 'pythondili', 'blogspot.com']

görüldüğü gibi karakter dizimizdeki . alanlarından 2 tanesinde ayırma işlemi yaptı.Eğer
site.split(".",3) yapsaydık

>>> site.split(".",3)
['wwww', 'pythondili', 'blogspot', 'com']

eğer ayıracağımız karakter, bizim karakter dizimizde yok ise

>>> site.split(",",3)
['wwww.pythondili.blogspot.com']

ayırma işlemi yapmayacaktır.

Karakter Dizi Metodlar-3

Yazar: Unknown Tarih: 21 Ocak 2012 Cumartesi Yorum: (0)
Expandtabs metodu
Bu metod ile karakter dizimizdeki sekme boşluklarının büyüklüğünü artırabiliyoruz.

>>> x="python\töğreniyorum."
>>> x.expandtabs(5)
'python    öğreniyorum.'

FIND metodu
Bu metod ile bir karakter dizisi içindeki bir karakterin kaçıncı konumda olduğunu bize söylüyor.

>>> a="Python kolay bir dil"
>>> a.find("o")
4

Gördüğümüz gibi "o" harfinin kaçıncı karakter(0'dan başladığını hatırlayalım) olduğunu bize verdi.
Ama "Python" dilinden sonra bir "o" harfi olan kelimemiz daha var.Ama python solda sağa doğru
okuma yaptığı için ilk "o" harfinin bulunduğu değeri verdi.

eğer arama yaptığımız harf yok ise -1 değerini bize döndürecektir.


>>> a="Python"
>>> a.find("i")
-1

Python bize aralık olarak arama yapmada imkanı veriyor:

>>> a="Python kolay bir dil"
>>> a.find("n",0,6)
5

Bu örnekte 0 ile 6. karakterler arasını araştırp bize "n" harfinin kaçıncı karakter olduğunu
söylemesini istedik.

Rfind metodu
Bu metod find metodu ile aynı görevi yapar fakat tek farkı karakter dizilerini soldan sağa değilde
sağdan sola doğru okur.

>>> a="python"
>>> a.rfind("p")
0


İndex metodu
find() metodu ile aynı işelve sahiptir.Tek değişik yönleri;fin() metodu bir karakteri bulamadığında
-1 değerini döndürür,index() metodu ise hata mesajı.

rindex metodu
Bu da index metodunun soldan sağa yaptığı okuma işini sağdan sola yapmaktadır.

join metodu
Bu metod karakter dizimizdeki her karakter arasına yeni bir karakter ekleme imkanı verir.

>>> a="python"
>>> "-".join(a)
'p-y-t-h-o-n'


>>> a=["php","jquery","ajax","android","python","c#","c++","java"]
>>> ":".join(a)
'php:jquery:ajax:android:python:c#:c++:java'


translate metodu
Bu metodu anlatmak hem karışık hemde zor olduğu için bu metodu istihza.com'dan alıntı yapacağım.


str.maketrans ve translate Metotları

Bu iki metot birbiriyle bağlantılı olduğu için, bunları bir arada göreceğiz.

Diyelim ki elimizde bir karakter dizisi var ve biz bu karakter dizisini şifrelemek istiyoruz. Bunun için şöyle bir kod yazdığımızı varsayalım:

sözlük = {"a":"0",
          "b":"1",
          "c":"2",
          "ç":"3",
          "d":"4",
          "e":"5",
          "f":"6",
          "g":"7",
          "ğ":"8",
          "h":"9",
          "ı":"a",
          "i":"b",
          "j":"c",
          "k":"ç",
          "l":"d",
          "m":"e",
          "n":"f",
          "o":"g",
          "ö":"h",
          "p":"ı",
          "r":"i",
          "s":"j",
          "ş":"k",
          "t":"l",
          "u":"m",
          "ü":"n",
          "v":"o",
          "y":"ö",
          "z":"p",
          " ":" "}

kardiz = "python programlama dili"

şifreli = ""
for i in kardiz:
        şifreli = şifreli + sözlük[i]

print(şifreli)

Bu kodu çalıştırdığımız zaman şöyle bir çıktı alırız:

ıöl9gf ıig7i0ed0e0 4bdb

Aslında bu çıktıda “python programlama dili” yazıyor. Biz yukarıdaki kodlar yardımıyla karakter dizimizi şifreledik. Python, yazdığımız sözlüğü temel alarak “p” harfi gördüğü yere “ı” harfini; “y” harfi gördüğü yere “ö” harfini, “t” gördüğü yere “l” harfini... yerleştiriyor. Böylece karakter dizimizin çıplak gözle anlaşılmasını engelleyecek bir çıktı veriyor bize. İsterseniz yukarıdaki kodları bir fonksiyon olarak tanımlayıp çok daha verimli bir hale getirebiliriz:

sözlük = {"a":"0",
          "b":"1",
          "c":"2",
          "ç":"3",
          "d":"4",
          "e":"5",
          "f":"6",
          "g":"7",
          "ğ":"8",
          "h":"9",
          "ı":"a",
          "i":"b",
          "j":"c",
          "k":"ç",
          "l":"d",
          "m":"e",
          "n":"f",
          "o":"g",
          "ö":"ğ",
          "p":"h",
          "r":"ı",
          "s":"i",
          "ş":"j",
          "t":"k",
          "u":"l",
          "ü":"m",
          "v":"n",
          "y":"o",
          "z":"ö",
          " ":" "}

def sifrele(kardiz):
        şifreli = ""
        for i in kardiz:
                şifreli = şifreli + sözlük[i]

        return şifreli

print(sifrele("python programlama dili"))

Fonksiyonumuzu bir kez bu şekilde tanımladıktan sonra sadece sifrele() fonksiyonunu kullanarak karakter dizilerimizi şifreleyebiliriz:

>>> print(sifrele("merhaba dünya"))

e5i9010 4nfö0

Burada bazı sorunlar olduğu açık. Mesela sözlük içinde tanımlanmamış karakter kullanıldığında programımız hata verecektir. Ayrıca açıkçası bu kodlar biraz “kalabalık” görünüyor göze...

İsterseniz yukarıdaki işlemi daha sade ve performanslı bir biçimde yapmanın bir yolu vardır Python’da...

Bunun için str.maketrans() ve translate() metotlarından yararlanacağız. Şu kodlara bir bakalım:

kaynak_dizi = "abcçdefgğhıijklmnoöprsştuüvyz"
hedef_dizi =  "0123456789abcçdefgğhıijklmnoö"
çeviri_nesnesi = str.maketrans(kaynak_dizi, hedef_dizi)

kardiz = "python programlama dili"

sonuç = kardiz.translate(çeviri_nesnesi)

print(sonuç)

Burada yaptığımız şey çok basit. Öncelikle “kaynak_dizi” adında bir karakter dizisi oluşturduk. Amacımız bir karakter dizisi içindeki karakterleri başka karakterlere dönüştürmek. İşte bu “kaynak_dizi” adlı karakter dizisi özgün kaynak dizimizin karakterlerini temsil ediyor. Alt satırdaki “hedef_dizi” adlı karakter dizisi ise, kaynak dizi içindeki karakterlerin dönüştürüleceği karakterleri gösteriyor. Bu iki karakter dizisini, bir üstteki kodlarda sözlük halinde yazmıştık. Buradaki “kaynak_dizi” adlı karakter dizisi bir önceki kodlardaki sözlüğün “anahtar”larının (keys), “hedef_dizi” adlı karakter dizisi ise sözlüğün “değer”lerinin (values) yerini tutuyor.

Karakter dizilerimizi tanımladıktan sonra str.maketrans() metodunu kullanarak bir “çeviri nesnesi” oluşturacağız. Oluşturacağımız bu çeviri nesnesi, biraz önce tanımladığımız “kaynak_dizi” ve “hedef_dizi” adlı karakter dizilerinin öğelerini birbiriyle eşleştirme vazifesi görecek. Zaten “str.maketrans(kaynak_dizi, hedef_dizi)” satırı bu vazifeyi gözler önüne seriyor... Bu arada maketrans() metodunu, öteki metotlardan farklı olarak str.maketrans() şeklinde kullandığımıza özellikle dikkat edin.

Hemen ardından çeviri işlemine tabi tutacağımız karakter dizimizi yazdık. Bu karakter dizimiz “python programlama dili”.

Daha sonra da “sonuç” adlı bir değişken içinde translate() metodundan faydalanarak yukarıda oluşturduğumuz “çeviri_nesnesi”ni bu metoda argüman olarak veriyoruz. Bu metot, “kardiz” adlı karakter dizisini alıp, yukarıda “çeviri_nesnesi” içinde belirlediğimiz formüle göre çeviri işlemine tabi tutuyor ve ortaya şifrelenmiş bir karakter dizisi çıkarıyor...