ASCII Kodlari Nelerdir ve Nerelerde Kullanilir

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    • ASCII Kodlari Nelerdir ve Nerelerde Kullanilir



      ASCII Kodlari Nelerdir ve Nerelerde Kullanilir

      ASCII Kodlari nedir

      ASCII (İngilizce: American Standard Code for Information Interchange, Türkçe: Bilgi Değişimi İçin Amerikan Standart Kodlama Sistemi) Latin alfabesi üzerine kurulu 7 bitlik bir karakter kümesidir. İlk kez 1963 yılında ANSI tarafından standart olarak sunulmuştur.

      Mesala Bir forumumuz var, ve bu eski Vbulletin olsun, veya WBB 2.3.6 olsun, bunu yeni WBB 3.1.8 foruma taşidinmi, yeni forumda, eski forumdaki konular hatali harfler halinde gözüküyor. Bazi türkce harfleri tanimiyor, cünkü eski forum daki Türkçe karakter sistemi, hangi script olursa olsun, bu eger "iso 8859-9" ise, ve yeni forum ise "utf-8" Türkçe karakter sisteminde ise, haliyle ikisi birbiriyle uyuşmuyor, ve yeni forumda artik eski "iso 8859-9" deki türkce karekerleri tanimyor, ve yerine "ASCII kodlari" denen kodlar halinde gösteriyor mesela alttaki tableya bakinca yahut internet sayfamizin alltaki linkine tiklayinca direk kopyeleyip yapiştırabilecegğiniz kodlar yazi halindeki tabelamizi görebilirsiniz ve mesesal orda Türkçe karakter "ü" harfi olan yerlerde ASCII kodu olan "& # 252 ;" yazacakdir yine yahut mesala parenter isareti olan “ yerine yine "& # 8220 ; " ASCII kodu gözükcekdir işde yenı foromunuzda eger "Wordmatch" plugini yüklenmişse yada degilse yüklüyebilirsiniz, "Wordmatch" nedir peki? forumunzdaki yasakli kelimelerin yerine başka kelime giren plugin. ben bunun ingilizce isimini"Wordmatch" diye yazdim bu fonksioynu yapan hangi isimdeki plugin olursa olsun, o bunu yapabilir. ve oraya bu alttaki kod listesindeki Türkçe karakterlerin ASCII kodlarini yazip, bunlarla o türkce kareketerin uf8 deki karşılığı olan normal halleri ile degiştir fonksiyonunu kullanadiginiz zaman, artik forumunzdaki, o bozuk harfler ve yazilar düzelip gercek halinde gözükcekdir.

      Yine ikinci olarak mesala kendi internet sayfamiza, web sitemize ekledigimiz resimleri eklerken, upload ettigimiz resimin isiminde, ya türkce kareketer, yada mesala bir isim verdik o resime ve bu isim "güzel cicek resimi_1.png" yaziyorsa, eger serverimiz buna müsade ediyorsa tabiki, bunu bu halilye upload ettigimizde, yüklü oldugu halde sayfamizdaki o resimin linki olan dizini browsere yazdigimiz halde, resim gözükmeyecekdir, mesela ben bir örnek ile bunu göstereyim.
      bu resimin normal linki bu şekilde amma, bunu forumumuzda bu haliyle tanitmayiz, bazen forum bunu tanimaz, cünkü isimde türkce kareketer olan ü var yine boşluk var.
      Bu resimin orjinal haliyle ben linkini böyle yazarim

      Quellcode

      1. http://efsane1turk.net/efsaneuploads/güzel cicek resimi_1.png

      amma burdaki o isimdeki güzel ile cicek arasinda, bir adet harf olmayan boşluk var, bunu forum scripti, resim linki olrak tanimaz, yine türkce karekter olan "güzel"kelimesinde "ü" harfi var, bunuda tanimaz, onlarin yerine eger biz bu ASCI HTML kodlarinda bunlarin yerine gecen kodlari koyupda, öyle linkimizi yazarsak, o zaman resim olarak gözükür, yoksa ilk hali ile gözükmez.
      yeni halindeki o boşluk ve ü nün yerine kodlari koyulmuş haliyle resimimizin linki veya dosyamizin linki böyle olmalidir.

      Quellcode

      1. http://efsane1turk.net/efsaneuploads/g%C3%BCzel%20cicek%20resimi_1.png

      resimimiz bu haliyle resim olarak gözükcekdir.



      Burada "boşluk"yerine "%20" yazmamiz gerekiyor ve yine "ü" yerine burada "C3%BC" gelmiş

      yahut alttakı tabelada bunun yerine "%fc" geliyor amma urlde ise bunu "%fc" yerine "%C3%BC" kullaniyor.

      Quellcode

      1. [img]http://efsane1turk.net/efsaneuploads/g%fczel%20cicek%20resimi_1.png[/img]

      bu halilyede gözükmez

      Bu Sayfadan istediginiz harfi veya karekteri girip o harfin ve karekterin kodlarini bulabilirsiniz.

      :arrow_1

      graphemica.com/


      "boşluk" yerine "%20" yazmamiz gerekiyor

      "ü" yerine "C3%BC" yazmamiz gerekiyor

      "ü" yerine burada "%fc" yazmamiz gerekiyor

      ASCII karakterlerin HTML diline göre şifrelenmiş biçimleri

      "ü" Harfinin ASCII kodu nedir & # 252;
      "ğ" Harfinin ASCII kodu nedir & # 287;
      "ç" Harfinin ASCII kodu nedir & # 231;
      "ı" Harfinin ASCII kodu nedir & # 305;

      "ü" Harfinin ASCII URL-Kodlanmış kodu nedir "%C3%BC"
      "ğ" Harfinin ASCII URL-Kodlanmış kodu nedir "%C4%9F"
      "ç" Harfinin ASCII URL-Kodlanmış kodu nedir "%C3%A7"
      "ı" Harfinin ASCII URL-Kodlanmış kodu nedir "%C4%B1"

      Bu kodlarin oldgu sayfamizin adresi burda

      :buradanindir

      Buradan BAK




      Türkçe Karakterler; ç ,ı ,ğ, ö , ş , ü , Ç, İ , Ğ, Ö, Ş, Ü harfleridir.

      ç harfinin ascıı kodu>> & # 231;
      ı harfinin ascıı kodu>> & # 305;
      ğ harfinin ascıı kodu>> & # 287;
      ö harfinin ascıı kodu>> & # 246;
      ş harfinin ascıı kodu>> & # 351;
      ü harfinin ascıı kodu>> & # 252;
      Ç harfinin ascıı kodu>> & # 199;
      İ harfinin ascıı kodu>> & # 304;
      Ğ harfinin ascıı kodu>> & # 208;
      Ö harfinin ascıı kodu>> & # 214;
      Ş harfinin ascıı kodu>> & # 350;
      Ü harfinin ascıı kodu>> & # 220;


      UTF-8 8-bitlik Unicode karşılıkları

      Harf: Ü UTF-8 Kodu: Ãœ
      Harf: Ş UTF-8 Kodu: ÅŸ
      Harf: Ğ UTF-8 Kodu: ÄŸ
      Harf: Ç UTF-8 Kodu: Ç
      Harf: İ UTF-8 Kodu: Ä°
      Harf: Ö UTF-8 Kodu: Ö
      Harf: ü UTF-8 Kodu: ü
      Harf: ş UTF-8 Kodu: ÅŸ
      Harf: ğ UTF-8 Kodu: ÄŸ
      Harf: ç UTF-8 Kodu: ç
      Harf: ı UTF-8 Kodu: ı
      Harf: ö UTF-8 Kodu: ö

      Numerik Karşılık

      Harf: İ Numerik Kodu: İ
      Harf: ı Numerik Kodu: ı
      Harf: Ö Numerik Kodu: Ö
      Harf: ö Numerik Kodu: ö
      Harf: Ü Numerik Kodu: Ü
      Harf: ü Numerik Kodu: ü
      Harf: Ç Numerik Kodu: Ç
      Harf: ç Numerik Kodu: ç
      Harf: Ğ Numerik Kodu: Ğ
      Harf: ğ Numerik Kodu: ğ
      Harf: Ş Numerik Kodu: Ş
      Harf: ş Numerik Kodu: ş

      Ansi Karşılıkları

      Harf: Ü UTF-8 Kodu: Ãœ
      Harf: Ş UTF-8 Kodu: Ş
      Harf: РUTF-8 Kodu: Ğ
      Harf: Ç UTF-8 Kodu: Ç
      Harf: İ UTF-8 Kodu: Ä°
      Harf: Ö UTF-8 Kodu: Ö
      Harf: ü UTF-8 Kodu: ü
      Harf: ş UTF-8 Kodu: ÅŸ
      Harf: ğ UTF-8 Kodu: ÄŸ
      Harf: ç UTF-8 Kodu: ç
      Harf: ı UTF-8 Kodu: ı
      Harf: ö UTF-8 Kodu: ö



      ASCII'de 33 tane basılmayan kontrol karakteri ve 95 tane basılan karakter bulunur. Kontrol karakterleri metnin akışını kontrol eden, ekranda çıkmayan karakterlerdir. Basılan karakterler ise ekranda görünen, okuduğumuz metni oluşturan karakterlerdir. ASCII'nin basılan karakterleri aşağıda belirtilmiştir.










      Karakter Kodlama (Character Encoding)

      Bu bölüme gelinceye kadar Python programlama dilindeki karakter dizisi, liste ve dosya adlı veri tiplerine ilişkin epey söz söyledik. Artık bu veri tiplerine dair hemen hemen bütün ayrıntıları biliyoruz. Ancak henüz öğrenmediğimiz, ama programcılık maceramız açısından mutlaka öğrenmemiz gereken çok önemli bir konu daha var. Bu önemli konunun adı, karakter kodlama.

      Bu bölümde ‘karakter kodlama’ adlı hayati konuyu işlemenin yanısıra, son birkaç bölümde üstünkörü bir şekilde üzerinden geçtiğimiz, ama derinlemesine incelemeye pek fırsat bulamadığımız bütün konuları da ele almaya çalışacağız. Bu konuyu bitirdikten sonra, önceki konuları çalışırken zihninizde oluşmuş olabilecek boşlukların pek çoğunun dolduğunu farkedeceksiniz. Sözün özü, bu bölümde hem yeni şeyler söyleyeceğiz, hem de halihazırda öğrendiğimiz şeylerin bir kez daha üzerinden geçerek bunların zihnimizde iyiden iyine pekişmesini sağlayacağız.

      Hatırlarsanız önceki derslerimizde karakter dizilerinin encode() adlı bir metodu olduğundan söz etmiştik. Aynı şekilde, dosyaların da encoding adlı bir parametresi olduğunu söylemiştik. Ayrıca bu encoding konusu, ilk derslerimizde metin düzenleyici ayarlarını anlatırken de karşımıza çıkmıştı. Orada, yazdığımız programlarda özellikle Türkçe karakterlerin düzgün görünebilmesi için, kullandığımız metin düzenleyicinin dil kodlaması (encoding) ayarlarını düzgün yapmamız gerektiğini üstüne basa basa söylemiştik. Biz şu ana kadar bu konuyu ayrıntılı olarak ele almamış da olsak, siz şimdiye kadar yazdığınız programlarda Türkçe karakterleri kullanırken halihazırda pek çok problemle karşılaşmış ve bu sorunların neden kaynaklandığını anlamakta zorlanmış olabilirsiniz.

      İşte bu bölümde, o zaman henüz bilgimiz yetersiz olduğu için ertelediğimiz bu encoding konusunu bütün ayrıntılarıyla ele alacağız ve yazdığımız programlarda Türkçe karakterleri kullanırken neden sorunlarla karşılaştığımızı, bu sorunun temelinde neyin yattığını anlamaya çalışacağız.

      O halde hiç vakit kaybetmeden bu önemli konuyu incelemeye başlayalım.
      Giriş

      Önceki bölümlerde sık sık tekrar ettiğimiz gibi, bilgisayar dediğimiz şey, üzerinden elektrik geçen devrelerden oluşmuş bir sistemdir. Eğer bir devrede elektrik yoksa o devrenin değeri 0 volt iken, o devreden elektrik geçtiğinde devrenin değeri yaklaşık +5 volttur.

      Gördüğünüz gibi, ortada iki farklı değer var: 0 volt ve +5 volt. İkili (binary) sayma sisteminde de iki değer bulunur: 0 ve 1. İşte biz bu 0 volt’u ikili sistemde 0 ile, +5 volt’u ise 1 ile temsil ediyoruz. Yani devreden elektrik geçtiğinde o devrenin değeri 1, elektrik geçmediğinde ise 0 olmuş oluyor. Tabii bilgisayar açısından bakıldığında devrede elektrik vardır veya yoktur. Biz insanlar bu ikili durumu daha kolay bir şekilde manipüle edebilmek için farklı voltaj durumlarından her birine sırasıyla 0 ve 1 gibi bir ad veriyoruz. Yani iki farklı voltaj değerini iki farklı sayı halinde ‘kodlamış’ oluyoruz...

      Hatırlarsanız bir önceki bölümde tasarladığımız basit iletişim modelinde de ampulün loş ışık vermesini sağlayan düşük elektrik sinyallerini 0 ile, parlak ışık vermesini sağlayan yüksek elektrik sinyallerini ise 1 ile temsil etmiştik. Bu temsil işine de teknik olarak ‘kodlama’ (encoding) adı verildiğini söylemiştik. İşte bilgisayarlar açısından da benzer bir durum söz konusudur. Bilgisayarlarda da 0 volt ve +5 volt değerleri sırasıyla ikili sayma sistemindeki 0 ve 1 sayıları halinde kodlanabilir.

      Sözün özü ilk başta yalnızca iki farklı elektrik sinyali vardır. Elbette bu elektrik sinyalleri ile doğrudan herhangi bir işlem yapamayız. Mesela elektrik sinyallerini birbiriyle toplayıp, birbirinden çıkaramayız. Ama bu sinyalleri bir sayma sistemi ile temsil edersek (yani bu sinyalleri o sayma sisteminde kodlarsak), bunları kullanarak, örneğin, aritmetik işlemleri rahatlıkla gerçekleştirebiliriz. Mesela 0 volt ile +5 voltu birbiriyle toplayamayız, ama 0 voltu ikili sistemdeki 0 sayısıyla, +5 voltu ise ikili sistemdeki 1 sayısıyla kodladıktan sonra bu ikili sayılar arasında her türlü aritmetik işlemi gerçekleştirebiliriz.

      Bilgisayarlar yalnızca iki farklı voltaj durumundan anladığı ve bu iki farklı voltaj durumu da ikili sayma sistemindeki iki farklı sayı ile kolayca temsil edilebildiği için, ilk bilgisayarlar çoğunlukla sadece hesap işlemlerinde kullanılıyordu. Karakterlerin/harflerin bilgisayar dünyasındaki işlevi bir hayli kısıtlıydı. Metin oluşturma işi o zamanlarda daktilo ve benzeri araçların görevi olarak görülüyordu. Bu durumu, telefon teknolojisi ile kıyaslayabilirsiniz. İlk telefonlar da yalnızca iki kişi arasındaki sesli iletişimi sağlamak gibi kısıtlı bir amaca hizmet ediyordu. Bugün ise, geçmişte pek çok farklı cihaza paylaştırılmış görevleri akıllı telefonlar aracılığıyla tek elden halledebiliyoruz.

      Peki bir bilgisayar yalnızca elektrik sinyallerinden anlıyorsa, biz mesela bilgisayarları nasıl oluyor da metin girişi için kullanabiliyoruz?

      Bu sorunun cevabı aslında çok açık: Birtakım elektrik sinyallerini, birtakım aritmetik işlemleri gerçekleştirebilmek amacıyla nasıl birtakım sayılar halinde kodlayabiliyorsak; birtakım sayıları da, birtakım metin işlemlerini gerçekleştirebilmek amacıyla birtakım karakterler halinde kodlayabiliriz.

      Peki ama nasıl?


      Bir önceki bölümde bahsettiğimiz basit iletişim modeli aracılığıyla bunun nasıl yapılacağını anlatmıştık. Tıpkı bizim basit iletişim sistemimizde olduğu gibi, bilgisayarlar da yalnızca elektrik sinyallerini görür. Tıpkı orada yaptığımız gibi, bilgisayarlarda da hangi elektrik sinyalinin hangi sayıya; hangi sayının da hangi karaktere karşılık geleceğini belirleyebiliriz. Daha doğrusu, bilgisayarların gördüğü bu elektrik sinyallerini sayılara ve karakterlere dönüştürebiliriz. Dışarıdan girilen karakterleri de, bilgisayarların anlayabilmesi için tam aksi istikamette sayıya, oradan da elektrik sinyallerine çevirebiliriz. İşte bu dönüştürme işlemine karakter kodlama (character encoding) adı verilir.

      Bu noktada şöyle bir soru akla geliyor: Tamam, sayıları karakterlere, karakterleri de sayılara dönüştüreceğiz. Ama peki hangi sayıları hangi karakterlere, hangi karakterleri de hangi sayılara dönüştüreceğiz? Yani mesela ikili sistemdeki 0 sayısı hangi karaktere, 1 sayısı hangi karaktere, 10 sayısı hangi karaktere karşılık gelecek?

      Siz aslında bu sorunun cevabını da biliyorsunuz. Yine bir önceki bölümde anlattığımız gibi, hangi sayıların hangi karakterlere karşılık geleceğini, sayılarla karakterlerin eşleştirildiği birtakım tablolalar yardımıyla rahatlıkla belirleyebiliriz.

      Bu iş ilk başta kulağa çok kolaymış gibi geliyor. Esasında iş kolaydır, ama şöyle bir problem var: Herkes aynı sayıları aynı karakterlerle eşleştirmiyor olabilir. Mesela durumu bir önceki bölümde tasarladığımız basit iletişim modeli üzerinden düşünelim. Diyelim ki, başta yalnızca bir arkadaşınızla ikinizin arasındaki iletişimi sağlamak için tasarladığınız bu sistem başkalarının da dikkatini çekmiş olsun... Tıpkı sizin gibi, başkaları da loş ışık-parlak ışık karşıtlığı üzerinden birbiriyle iletişim kurmaya karar vermiş olsun. Ancak sistemin temeli herkesçe aynı şekilde kullanılıyor olsa da, karakter eşleştirme tablolarını herkes aynı şekilde kullanmıyor olabilir. Örneğin başkaları, kendi ihtiyaçları çerçevesinde, farklı sayıların farklı karakterlerle eşleştirildiği farklı tablolar tasarlamış olabilir. Bu durumun dezavantajı, farklı sistemlerle üretilen mesajların, başka sistemlerde aslı gibi görüntülenemeyecek olmasıdır. Örneğin ‘a’ harfinin 1010 gibi bir sayıyla temsil edildiği sistemle üretilen bir mesaj, aynı harfin mesela 1101 gibi bir sayıyla temsil edildiği sistemde düzgün görüntülenemeyecektir. İşte aynı şey bilgisayarlar için de geçerlidir.

      1960’lı yılların ilk yarısına kadar her bilgisayar üreticisi, sayılarla karakterlerin eşleştirildiği, birbirinden çok farklı tablolar kullanıyordu. Yani her bilgisayar üreticisi farklı karakterleri farklı sayılarla eşleştiriyordu. Örneğin bir bilgisayarda 10 sayısı ‘a’ harfine karşılık geliyorsa, başka bir bilgisayarda 10 sayısı ‘b’ harfine karşılık gelebiliyordu. Bu durumun doğal sonucu olarak, iki bilgisayar arasında güvenilir bir veri aktarımı gerçekleştirmek mümkün olmuyordu. Hatta daha da vahimi, aynı firma içinde bile birden fazla karakter eşleştirme tablosunun kullanıldığı olabiliyordu...

      Peki bu sorunun çözümü ne olabilir?

      Cevap elbette standartlaşma.

      Standartlaşma ilerleme ve uygarlık açısından çok önemli bir kavramdır. Standartlaşma olmadan ilerleme ve uygarlık düşünülemez. Eğer standartlaşma diye bir şey olmasaydı, mesela A4 piller boy ve en olarak standart bir ölçüye sahip olmasaydı, evde kullandığınız küçük aletlerin pili bittiğinde uygun pili satın almakta büyük zorluk çekerdiniz. Banyo-mutfak musluklarındaki plastik contanın belli bir standardı olmasaydı, conta eskidiğinde yenisini alabilmek için eskisinin ölçülerini inceden inceye hesaplayıp bu ölçülere göre yeni bir conta arayışına çıkmanız gerekirdi. Herhangi bir yerden bulduğunuz contayı herhangi bir muslukta kullanamazdınız. İşte bu durumun aynısı bilgisayarlar için de geçerlidir. Eğer bugün karakterlerle sayıları eşleştirme işlemi belli bir standart üzerinden yürütülüyor olmasaydı, kendi bilgisayarınızda oluşturduğunuz bir metni başka bir bilgisayarda açtığınızda aynı metni göremezdiniz. İşte 1960’lı yıllara kadar bilgisayar dünyasında da aynen buna benzer bir sorun vardı. Yani o dönemde, hangi sayıların hangi karakterlerle eşleşeceği konusunda uzlaşma olmadığı için, farklı bilgisayarlar arasında metin değiş tokuşu pek mümkün değildi.

      1960’lı yılların başında IBM şirketinde çalışan Bob Bemer adlı bir bilim adamı bu kargaşanın sona ermesi gerektiğine karar verip, herkes tarafından benimsenecek ortak bir karakter kodlama sistemi üzerinde ilk çalışmaları başlattı. İşte ASCII (‘aski’ okunur) böylece hayatımıza girmiş oldu.

      Peki bu ‘ASCII’ denen şey tam olarak ne anlama geliyor? Gelin bu sorunun cevabını, en baştan başlayarak ve olabildiğince ayrıntılı bir şekilde vermeye çalışalım.
      ASCII

      Bilgisayarların iki farklı elektrik sinyali ile çalıştığını, bu iki farklı sinyalin de 0 ve 1 sayıları ile temsil edildiğini, bilgisayarla metin işlemleri yapabilmek için ise bu sayıların belli karakterlerle eşleştirilmesi gerektiğini söylemiştik.

      Yukarıda da bahsettiğimiz gibi, uygarlık ve ilerleme açısından standartlaşma önemli bir basamaktır. Şöyle düşünün: Biz bilgisayarların çalışma prensibinde iki farklı elektrik sinyali olduğunu biliyoruz. Biz insanlar olarak, işlerimizi daha kolay yapabilmek için, bu sinyalleri daha somut birer araç olan 0 ve 1 sayılarına atamışız. Eğer devrede elektrik yoksa bu durumu 0 ile, eğer devrede elektrik varsa bu durumu 1 ile temsil ediyoruz. Esasında bu da bir uzlaşma gerektirir. Devrede elektrik yoksa bu durumu pekala 0 yerine 1 ile de temsil edebilirdik... Eğer elektrik sinyallerinin temsili üzerinde böyle bir uzlaşmazlık olsaydı, her şeyden önce hangi sinyalin hangi sayıya karşılık geleceği konusunda da ortak bir karara varmamız gerekirdi.

      Elektriğin var olmadığı durumu 0 yerine 1 ile temsil etmek akla pek yatkın olmadığı için uzlaşmada bir problem çıkmıyor. Ama karakterler böyle değildir. Onlarca (hatta yüzlerce ve binlerce) karakterin sayılarla eşleştirilmesi gereken bir durumda, ortak bir eşleştirme düzeni üzerinde uzlaşma sağlamak hiç de kolay bir iş değildir. Zaten 1960’lı yılların başına kadar da böyle bir uzlaşma sağlanabilmiş değildi. Dediğimiz gibi, her bilgisayar üreticisi sayıları farklı karakterlerle eşleştiriyor, yani birbirlerinden tamamen farklı karakter kodlama sistemleri kullanıyordu.

      İşte bu kargaşayı ortadan kaldırmak gayesiyle, Bob Bemer ve ekibi hangi sayıların hangi karakterlere karşılık geleceğini belli bir standarda bağlayan bir tablo oluşturdu. Bu standarda ise American Standard Code for Information Interchange, yani ‘Bilgi Alışverişi için Standart Amerikan Kodu’ veya kısaca ‘ASCII’ adı verildi.


      UTF-8 nedir?, kodlar, karakterler ve hakkında herşey!


      UTF-8 8-bitlik bir Unicode dönüşüm formatıdır (İng: Unicode Transformation Format ‘ın kısaltması). Unicode karakterlerini değişken uzunluklu bayt guruplarıyla kodlamakta kullanılır. Rob Pike ve Ken Thompson tarafından geliştirilmiştir.

      UTF-8 kodlaması Unicode karakterlerini 1-6 byte uzunluğunda diziler olarak kodlar. ASCII kodlaması içinde 0-127 arasında kalan karakterler aynen kendi kodları ile kullanılır, diğerleri ise byte dizileri haline gelir.

      UTF-8 Özellikleri

      Evrensel kodlama ile aynı sayfada farklı lisanları göstermek mümkün olabilmektedir. Ayrıca özel hazırlanmış klavyeler ile matematiksel ifadeleri yazmak da mümkün. Bütün bu farklı karakterler UTF-8 sayesinde aynı sayfada görüntülenebilmektedir. Eski stil kodlama ile türkçe karakterlerin – aslında latin alfabesinde olmayan ya da özel işaretli harflerin de – gösterimi için oldukça karışık olan harf ve rakam dizgileri kullanmak gerekiyordu. Mesela Ş harfini yazmak için Ş küçük ş içinse ş yazmak gibi.

      UTF kullanarak 1 milyondan fazla karakter kodlanılabilinmektedir. Sıklıkla kullanılan 65536 karakterin kodlaması bu 1 milyondan fazla kodlamada ilk sıralarda yer almaktadır.

      UTF-8 Örnekler

      A = 00000000 010000012, yani sağ baştan sıfırdan başlayarak sayıldığıda 2′nin katları şeklinde 20 ve 26′yı toplayarak 65 sayısını elde ediyoruz. Windows için ALT-tuşuna basılı tutarak nümerik klavyeden 65 yazdığı zaman A harfı çıkar.

      天 = 0×59 0×298 = 01011001 001010012 = ALT-tuşu + 22825
      ⇔ = 0×21 0xd38 = 00100001 110100112 = ALT-tuşu + 1587
      α = 0×03 0xb18 = 00000011 101100012 = ALT-tuşu + 945
      Veritabanı ve Programlamada UTF-8′in yeri:

      Programlama ve Veri depolamada UTF-8‘in yeri oldukça önemlidir.

      UTF-8′in çeşitleri vardır, bunlar temel olarak:
      utf8_bin : Unicode – Çok Dilli (Universal Code – Unicode) – İkili (Binary)
      utf8_czech_ci : Çekçe – Büyük ve Küçük harfe duyarsız
      utf8_danish_ci : Danca – Büyük ve Küçük harfe duyarsız
      utf8_esperanto_ci : Esperanto – Büyük ve Küçük harfe duyarsız
      utf8_estonian_ci : Estçe – Büyük ve Küçük harfe duyarsız
      utf8_general_ci : Unicode (çokdilli) – Büyük ve Küçük harfe duyarsız
      utf8_hungarian_ci : Macarca – Büyük ve Küçük harfe duyarsız
      utf8_icelandic_ci : İzlandaca – Büyük ve Küçük harfe duyarsız
      utf8_latvian_ci : Litvanyaca – Büyük ve Küçük harfe duyarsız
      utf8_lithuanian_ci : Litvanyaca – Büyük ve Küçük harfe duyarsız
      utf8_persian_ci : Farsça – Büyük ve Küçük harfe duyarsız
      utf8_polish_ci : Polonyaca – Büyük ve Küçük harfe duyarsız
      utf8_roman_ci : Batı Avrupa – Büyük ve Küçük harfe duyarsız
      utf8_romanian_ci : Romence – Büyük ve Küçük harfe duyarsız
      utf8_slovak_ci : Slovakça – Büyük ve Küçük harfe duyarsız
      utf8_slovenian_ci : Slovence – Büyük ve Küçük harfe duyarsız
      utf8_spanish2_ci : Geleneksel İspanyolca – Büyük ve Küçük harfe duyarsız
      utf8_spanish_ci : İspanyolca – Büyük ve Küçük harfe duyarsız
      utf8_swedish_ci : İsveççe – Büyük ve Küçük harfe duyarsız
      utf8_turkish_ci : Türkçe – Büyük ve Küçük harfe duyarsız
      utf8_unicode_ci : Unicode – Çok Dilli (Universal Code – Unicode) Büyük ve Küçük harfe duyarsız
      21 çeşittir.

      Eğer Türkçe karakterler ve bunun yanında birkaç dilin karakterlerini kullanmayı düşünüyorsanız UTF-8 Unicode (utf8_unicode_ci) tam sizin için.
      Eğer UTF-8 Unicode kullanırsanız, artık yazılım geliştirme ortamınızın, veritabanınızın ve html kodlarınızın karakter setlerinin farklılığından kaynaklanan görüntüleme problemlerinden kurtulacaksınız.
      Şimdi size birkaç yazılım geliştirme ortamında UTF-8 ayarının yapılabilmesi için izlemeniz gereken yönergeleri anlatacağım:
      Zend Development Environment:
      Araçlar (Tools) -> Tercihler… (Preferences…) -> Masaüstü (Desktop) tabının içinde Kodlama (Encoding) seçeneğini UTF-8 olarak ayarlamanız yeterli.
      Notepad :
      Dosya (File, Save) kayıt penceresinde, Kodlama (Encoding) seçeneğini UTF8 olarak ayarlamanız yeterli.
      Notepad++ :
      Ayarlar (Settings) -> Tercihler (Preferences) -> Yeni bir Belge (New a Document) -> Encoding bölümünden UTF-8 seçmeniz yeterli.
      Dreamweaver :
      Düzen (Edit) -> Tercihler (Preferences) -> Fonts (Yazı tipleri) -> Unicode ve ayrıca Yeni (New Document) bölümünden Unicode’u seçmeniz yeterli.

      ***

      Eğer Türkçe karakterler ve bunun yanında birkaç dilin karakterlerini kullanmayı düşünüyorsanız UTF-8 Unicode (utf8_unicode_ci) size önerilir.

      Utf-8 Sorun ve Çözümleri
      Utf-8, Google’ ın en çok tercih ettiği karakter dili olması ve SEO,Pretty Url gibi optimizasyon araçlarının desteklediği karakter grubu olması nedeniyle webmasterlar bu dili tercih ederler.Fakat bu dil SMF scriptinde “ISO-8859-9″ karakter dilini kullananlar Türkçe karakter sorunları yaşamaktadır.Bu sorunlar nelerdir ve çözümleri nelerdir:

      1- Utf-8 i sorunsuz şekilde kurabilmek(Modifikasyonlar bozulmadan):
      Admin/Forum Bakımından “Veri ve veritabanını utf-8 e dönüştür” seçeneği ile önce veritabanı utf-8 e dönüştürülür.Daha sonra gerekli utf-8 dosyaları default ya da kullandığınız temanın languages klasörüne atılır.Modifikasyonları bozmamak için de:
      Mesela “Modification.turkish.php” dosyasında modifikasyonların dil değişkenleri yer alıyorsa bu dosya Notepad dosyasında açılarak Farklı Kaydet seçeneği seçilir ve kodlama Utf-8 olarak işaretlenerek dosya ismi sonuna -utf8 yazılarak kaydedilir.Daha sonra languages klasöründekiyle yer değiştirilir.(mesela Modification.turkish-utf8.php gibi) Şayet hata alırsanız “ayarlari_onar.php yi çalıştırın ve dil kısmına “turkish-utf8” yazın.Ayrıca Settings.php dosyanızda

      ---------------
      Etiketler : ASCCI Code, ASCII HTML kodlari, ASCII Kodlari, forumumu tasidm harf hatasi var, Kullanilir, link yanlismi, linki nasil düzeltirim, nasil düzeltirim, Nelerdir, resim gözükmüyor, resimimi yükledim amm link calismiyor, ve Nerelerde,"boşluk" yerine "%20" yazmamiz gerekiyor,"ü" yerine "C3%BC" yazmamiz gerekiyor,"ü" yerine burada "%fc" yazmamiz gerekiyor,"ü" Harfinin ASCII kodu nedir , "ğ" Harfinin ASCII kodu nedir ,"ç" Harfinin ASCII kodu nedir ,"ı" Harfinin ASCII kodu nedir,URL-Kodlanmış kodu nedir,"ü" Harfinin ASCII URL-Kodlanmış kodu nedir , "%C3%BC" , "ğ" Harfinin ASCII URL-Kodlanmış kodu nedir , "%C4%9F" , "ç" Harfinin ASCII URL-Kodlanmış kodu nedir , "%C3%A7" , "ı" Harfinin ASCII URL-Kodlanmış kodu nedir , "%C4%B1",