|
Scanner ( Tarayıcı)
Bir tarayıcı fotoğraf
gazete kupürü gibi resim veya grafikleri sayısallaştırabilmenizi sağlar.
Eldeki resim ışığa duyarlı yarıiletken elemanlar (LDR’ler) tarafından
taranır. Bu elemanlardan alınan işaretler RAM’a yazılacak byte dizileri
haline getirilir. Dizi buradan ekrana aktarılır veya bir dosyaya saklanır.
Bir tarayıcıyı kurmak
Bir tarayıcıyı kullanmak için tarayıcı tarafından okunan bilgiyi PC’ye
aktaracak özel bir arabirim kartına ihtiyaç vardır. Bu da genellikle 8
bitlik bir kart olduğundan bir kısa genişleme yuvası tarayıcı kurmak için
yeterli olacaktır. Farklı tarayıcı üreticileri tamamen farklı veri aktarma
yöntemleri kullanmaktadırlar. Bu nedenle tarayıcıyı başka bir üreticinin
ara birim kartıyla çalıştırmak mümkün değildir. Bu durumda tarayıcının
bağlacının (connector) arabirimine uymadığını da gözle görürsünüz.
Bir çok tarayıcı ara birim kartı DMA (Direct Memoıy Access / Doğrudan
Bellek Erişimi) sistemini kullanır Bunun anlamı kartın tarayıcının
gönderdiği bilgiyi ayrılan bir bellek alanına yerleştirmesidir. Çalışan
yazılım daha sonra veriye bu alandan erişir. Bir çok arabirim kartı bir
atlama (jumper) ayarlaması ile DMA kanalının seçilmesine izin verse bile
genellikle varsayılan (default) ayarın değiştirilmesine gerek kalmaz.
Bir çok kart üreticisi tarafından doğru şekilde ayarlanmıştır. Eğer
sisteminiz tarayıcınızı kurduktan sonra DMA çakıştırılmasıyla karşı
karşıya kalırsa tarayıcı kartınızdaki ayarlarda bir başka DMA kanalını
seçmelisiniz. Ne yazık ki bu işlem tarayıcıya bağlı olarak değişir. Bu
nedenle varsayılan konfigürasyonu değiştirmeniz gerekirse tarayıcıyla
verilen dokümanı okuyunuz. Eğer kartı hangi konfigürasyonda çalıştırmanız
gerektiğinden emin değilseniz çekinmeden değişik ayarları deneyiniz. Ancak
bir değişiklik yapmadan önce mevcut ayarları bir kenara yazmayı
unutmayınız.
Genellikle ikinci bir anlatma ayarı da tarayıcı kartının bağlantı noktası
(port) adresinin seçilmesini sağlar. Yine, varsayılan ayarlar genellikle
doğrudur. Sadece eğer sisteminizde bir ağ kartı veya bir modem kartı gibi
çakışma yaratabilecek genişleme kartları varsa bu kartlardan birinin
bağlantı noktası ayarını değiştirmeniz gerekebilir.
Genellikle eski tarayıcı sistemlerini kullanmak için hazırdaki bir donanım
kesmesi (IRQ) gerekir. Bu durumda 8-bitlik bağdaştırıcı kartlarıyla
problemler yaşayabilirsiniz. Buradaki Problem ek bağlantı noktalan
yerleştirirken karşılaşılanın aynısıdır. 8-bitlik bir yuvada sadece 8 IRQ
kullanılabilir ve bunlar genellikle halen kullanılıyordur. Çakışma
genellikle ya olması gerektiği gibi IRQ7’yi veya diğer durumlarda IRQ5’i
kullanan yazıcı arabirimiyle olur. Öyle ise tarayıcımızı yazıcı
arabiriminin kullanmadığı bir kesmeye ayarlamalısınız. Eğer elinizde hangi
kesmelerin kullanıldığını gösteren bir test programı yoksa önce IRQ5’i
denemenizi öneririz.
Ayrıca tarayıcımız belki ikinci seri bağlantı noktasının (COM2) kullandığı
IRQ3 kesmesini paylaşarak da çalışabilir.
Bir kartın bağlantı noktası adresini, DMA kanalını veya bir IRQ
değiştirdiyseniz yeni ayarlan aktifleştirebilmek için kullanmakta
olduğunuz yazılımın tamamını yeniden yüklemek veya yeniden düzenlemek
zorunda kalabilirsiniz. Özellikle ağ kartlarındaki değişiklikler
karmaşıktır. Bu durumda bütün ağı yeniden kurmanız gerekebilir. Bunun için
ağ kartında bir değişikliği ancak diğer kartların ayarlarıyla oynayarak,
ki burada söz konusu tarayıcı kartıdır, problemi çözemiyorsanız yapın.
Kaliteli bir tarayıcı seçmeden önce DPI ve gri seviyesi terimlerini
anlamanız gerekir. Bu terimleri aşağıdaki örnekle açıklayanız.
Diyelim ki 10*10 inch (24.5 * 24.5 cm) boyutlarında bir resmi 800 DPI
(Dost Per Inch / Inch Başına Düşen Nokta) çözünürlükte ve 256 gri seviyesi
ile taramak istiyorsunuz. Bunu yapmak için 64 MB boş belleğe ihtiyacınız
olacaktır. 256 gri seviyeli bir görüntü piksel (dot) başına bir bayt
gerektirir. Böylece yukarıda bahsedilen resim toplam 64 milyon (8000 *
8000) pikselle taranacaktır.
Eğer bu resmin bu çözünürlükte bir baskısını istiyorsanız yazıcınızın 256
gri seviyeyi gösterebilmesi için her piksel başına 16 * 16’lık bir matrisi
basabilmelidir. Bu gereklidir çünkü yazıcılar gri seviyeleri ancak değişen
sıklıkta noktalar basarak oluşturabilirler. 300 DPI çözünürlüğü olan bir
lazer yazıcı dahi kullanılsa ortaya çıkan baskının eni ve boyu 8000 * 16
/300 veya yaklaşık 430 inch (10 metre) olurdu.
Sonuçta çıktınız 100 metrekare bir alanı kaplardı ve 1970 sayfa tutardı.
Dakikada 4 sayfa baskı hızında bütün resmin basılması sekiz saatten fazla
sürerdi.
Yukarıdaki örnekle anlatmaya çalıştığımız gibi iyi bir tarayıcı ille de
müthiş çözünürlüklerle veya gri seviyelerle karakterize edilmez. Bir
tarayıcı bu yeteneklere sahip olsa bile PC sisteminden beklentileri PC’nin
boyunu aşar. Bu yetenekler ancak posta pulu büyüklüğünde resimler
sayısallaştırıp sonra büyütecekseniz yararlı olabilir. Birçok durumda 300
DPI çözünürlükte ve 16 gri seviyeli bir tarayıcı yeterli olmaktadır. Bu
çözünürlükte mümkün olan sonuçlan düşünürseniz hiç gri seviyesi olmayan
(siyah beyaz) bir tarayıcıya da karar verebilirsiniz.
İyi bir tarayıcının göstergelerinden biri de tarayıcıyla birlikte gelen
yazılımdır. Genellikle bu bir tarayıcının en moral bozucu özelliğidir.
Sıklıkla yazılım uzatılmış (extended) bellek kullanamaz, veya taranan
resmin belli kısımlarını sabit diskinizde saklayamaz.
Bu programlarla kullanılan alışılmış belleğin sınırlı olması nedeniyle
oldukça küçük resim formatları taranabilir. Bunun için tarayıcıyla
birlikte gelen yazılımın üreticinin reklamlarında söylediği performansı
gösterip göstermediğini her zaman belirlemelisiniz.
Bazı el tarayıcılarının yararlı bir aksesuarı da dokümanları düzgün bir
doğru takip ederek taramanızı sağlayan kılavuz cetvelidir. Bu basit alet
görüntü kalitesini önemli ölçüde arttırmaktadır.
Yakın bir zamana dek çok fazla kullanılmayan tarayıcılar, özellikle
multimedia, yayıncılık ve tasarım gibi uygulamaların gelişmesine paralel
olarak hızla yayıldı Klavye, fare vb. veri giriş aygıtlarıyla, metinleri,
harfleri ve rakamları bilgisayara aktarmak mümkündür ama, görüntüler söz
konusu olduğunda klasik veri giriş yöntemleri işe yaramaz. Giderek
görüntülerin de standart veri türleri arasına girmesi ve PC’lerde grafik
ortama geçilmesi, tarayıcıları yaygınlaştırdı. Tarayıcıların daha önceden,
bugünkü kadar popüler olamayışlarının bir sebebi de, taranmış görüntülerin
bellekte çok fazla yer tutmasıydı. Bir kitap dolusu metin, sabit
diskinizde (kitabın boyutlarına göre) 100 ya da 300 KB’lık yer kaplarken,
taranmış bir görüntü 5-10-20, bazen 50 MB (resmine göre!) yer tutabiliyor.
Tarayıcıların çalışma ilkeleri basittir. Taranacak nesne (kağıt), üst
tarafından alta doğru satır satır ışığa duyarlı elektronik elemanlar
tarafından taranarak sayısallaştırır. Tarayıcının daha iyi yapılabilmesi
için nesne, bir ışık kaynağı ile aydınlatılır. Taranması istenen görüntü,
üzerinden ışık kaynağı geçtikten sonra bir mercek aracılığıyla,
fotoelektrik hücrelerden oluşmuş bir görüntü algılayıcı (image sensor)
üzerine düşürülür. (Yani, ışık değerleri ölçülür, ölçüm değerine göre bir
voltaj değeri üretilir.) Değişen voltajlarda elektrik impals üreten bu
algılayıcı, daha ışıklı ve daha açık tonlardaki desenleri yüksek voltajla,
koyu desenleri ise düşük voltajla gösterir. Analog voltaj sinyali, bir tür
modem gibi işleyen analog-sayısal dönüştürücü yongası ile
sayısallaştırılarak PC’nin belleğine aktarılır. Sinyaller, görüntü dosyası
formatında disk ortamına kaydedilir. Daha sonra bu dosya üzerinde görüntü
programları ile işlem yapabilirsiniz...
Tıpkı monitörler ve lazer yazıcılar gibi, tarayıcılarda da görüntüler çok
küçücük noktalardan oluşur. Yani aynı şekilde, birim alana düşen nokta
sayısı ne kadar yüksekse, elde edilen görüntü o kadar kaliteli olacaktır.
Günümüzde profesyonel yayıncılıkta kullanılacak bir tarayıcının
çözünürlüğü en az 2400 dpi olmalıdır. Multimedia gibi uygulamalarda ise,
taranan resimler basılmayacağı, sadece ekranda görüneceği için daha düşük
çözünürlükle yetinilebilir.
Tarayıcılar, sadece çözünürlüklerine göre değil, algılayabildikleri renk
sayısına göre de farklılık gösterirler. Renkli görüntüler bilgisayarda çok
daha fazla yer tuttuğu için, genellikle ve sıkıştırma programları da
kullanılır.
Profesyonel olmayan uygulamalarda, daha küçük boyutlarda olan el
tarayıcıları kullanılabilir. Sayfa üzerinde gezdirilerek kullanıldıkları
için el tarayıcılarının küçük bir üstünlükleri vardır: Bir kitaptan bir
görüntüyü taramak istediğinizde, sayfayı yırtmak yada kesmek zorunda
kalmazsınız... Ayrıca ucuz ve pratiktirler. Masa üstü tarayıcıları ise,
tıpkı fotokopi makinesi gibi kullanmak zorundasınız.
OCR (Optical Character Recognition) Optik
Karakter tanıma
Tarayıcıların getirdiği yeni bir olanak, görüntüler gibi yazıların da
kağıttan bilgisayara aktarılmalarını sağlamalarıdır. Ancak, tarayıcı ile
PC’ye aktarılan bir grafik dosyasına yazılan metinler, bilgisayar
tarafından resim olarak görülür. Bir fotoğraftan farkı olmayan grafik
dosyasının içindeki yazılar, 0CR (Optical Character Recognition; Optik
karakter tanıma) adı verilen programlar vasıtasıyla çözümlenip metin
dosyalarına çevrilir.
Böylece kağıt ortamındaki bir yazı, insan eliyle herhangi bir müdahaleye
ve klavyeden tekrar veri girişine gerek kalmadan bilgisayara
aktarılabilir. OCR programıyla ASCII metinlere dönüştürülen yazı üzerinde
istenen şekilde işlemde yapılabilir. Üstelik, yazıların görüntü dosyası
olarak değil de metin dosyası olarak saklanması çok daha az yer
gerektirir.
Bilgisayarın kalıcı bellek kapasiteleri geliştikçe kağıt ortamındaki
arşivler, tarayıcılar vasıtasıyla elektronik ortamlara aktarılıp
saklanabilecek. Böylece istenen belgelere çok daha hızlı ulaşmak mümkün
olabilecek, belgelerin zamanla bozulmasından dolayı oluşacak kayıplar
kalkacak, bilgilerin işlenmesi kolaylaşacak, gerekli fiziksel saklama
alanı azalacak...
Bunların hepsi iyi güzel de, bütün çabalara rağmen OCR yazılımlarının
yüzde yüz hatasız çalışması mümkün değil hala!
OCR yazılımları genellikle karmaşık teknikler algoritmalar kullanır. Eski
OCR teknolojisi, üst çizimde görülen matris yöntemine dayanırdı. Bu
yöntem, taranan harfi bir matris içine yerleştirerek matrisin hangi
hücrelerinin siyah olduğuna bakmaktan ibaretti. Elde edilen matris, harf
kütüphanesindeki bir harf ile eşleştirilmeye çalışılıyordu. Fakat bu
yöntemde farklı karakter tipleri (fontlar) büyük bir problem teşkil
ediyordu; değişik fontlarla yazılmış yanı P harfi, matrisin değişik
hücrelerinin siyah olmasına yol açıyor, bu da hatalara sebep oluyordu.
Ortadaki çizim ise, “omnifont” adı verilen daha yeni bir teknolojiyi
gösteriyor. Bütün fontları algılayabilen bu yöntem, harfleri bileşenlerine
ayırıyor, bu bileşenleri içeren karakterleri yakalamaya çalışıyor. Örneğin
P harfinin, dikey bir çizgi, bir daire ve bir yatay çizgiden oluştuğu
varsayılarak bu karakteristikler taranan metinde yakalandığında P harfine
çevriliyor.
Daha yeni bir teknoloji ise, “maksimum entropi” ilkesine göre işliyor:
Taranmış metinde varolan lekelere yenilerini ekleyerek eski anlamsız
lekelerden kurtulabiliyorsunuz!
Karakter tanıma, tek bir font söz konusu olduğunda çok daha kolay bir
işlem. Oysa günümüz teknolojisi, bilgisayarın el yazısı dahil, pek çok
değişik fontu da algılayabilmesini sağlamaya çalışıyor: PC’nizin, her bir
fontun harflerini belleğinde tutup, “bu acaba Helveticanın a’sı mı, yoksa
Times’in b’si mi?” diye tarama yapması hiç de kolay değil... Genelde,
bizler, hangi fontla basılırsa basılsın, ne kadar güç okunur bir el
yazısıyla yazılmış olursa olsun, harfleri tanırız ve karıştırmayız. Neden,
çünkü tek bir harfin “a” mı yoksa “o” mu olduğunu anlayamasak da, cümlenin
gelişi, dilimizin kelime haznesi yardımımıza koşar. “Bilgisayar” diye bir
sözcük olmadığı için, a harfini 1 diye görsek bile sorun çıkmaz...
Bu durumdan hareketle, tek tek harflerden ziyade bütünden anlam çıkarmaya
çalışan yöntemler geliştirildi. El yazısında da başarı sağlamaya çalışan
bir yöntem harfleri topolojik özellikleri çözümleyerek belirliyor ve bu
öğrendiklerine göre işlem yapıyor...
Karakter tanıma yazılımları, hata ortamını sıfıra indirmek için
karmaşıklaştıkça daha fazla güç daha fazla hız gerektiriyorlar. Bu
nedenle, yeni kuşak
PC’lerin, OCR uygulamalarında daha başarılı olacağı kesin.
Kaynak: http://www.bilgisayar.tv
|