Bu tanımlara şimdi son bir tane daha ekleyeceğiz, o da Stockman ve Shapiro’nunki. Tekrar “görme” teriminin anlamının altını çizecek olursam, herhangi bir duyuyla elde edilen datadan görsel bilgi çıkarma işlemidir. Bilgisayar duyduklarımızın görüntüsünü çizebilir veya bir kokunun şiddetine göre bir görsel şekil oluşturabilir. Bu bağlamda bilgisayarlı görmenin amacı: herhangi bir duyumsanan veriye göre, nesneler ve manzaralar hakkında kullanışlı kararlar verebilmektir.
Burada nesne olarak belirttiğimiz şeyin özellikle görsel olarak algılanabilir ve maddesel olması vurgulanmalıdır. Bu noktada objelerin sınıflandırılması karşımıza çıkar. Bilgisayarlar, nesne sınıfları hakkında sahip oldukları bilgilere göre karar vereceklerinden, sınıflandırılma ne kadar düzgün yapılırsa o kadar başarılı sonuç alınır. Ancak dünyada bizim ayırt ederek kullandığımız yaklaşık 30.000 nesne kategorisi olduğu düşünülürse, bunun hiç de kolay olmadığı anlaşılabillir. Manzara ise birden çok nesnenin bir araya gelerek oluşturduğu bir bütünlüktür. Tanımlamamızda belirttiğimiz duyumsanan veri ise; görsel, ısıl, kızılötesi, basınç, MR gibi sensörlerden alınan ve görsel bilgi taşıyan tüm veriler olabilir. Bu bilgilere göre verilen kararlar ise: nesneleri tanıma, ayırt etme, sınıflandırma, sınırlandırma, belirleme, bulup getirme, değiştirme, doğrulama gibi durumlardır. Şimdi dilerseniz bilgisayarların görsel bilgileri yorumlaması nasıl başlamış, bir tarihini inceleyelim.