આપણે ઇમેજ સર્ચ એન્જિનને કંઈક પૂછીએ અને તે આંખના પલકારામાં તેની અનેક તસવીર હાજર કરી દે એવો ‘ચમત્કાર’ કેવી રીતે થાય છે? મશીન જે તે તસવીરને ઓળખે છે કેવી રીતે?
ગયા અંકમાં ગૂગલ ઇમેજીસમાં રિવર્સ ફોટો સર્ચ વિશે જાણ્યા પછી સંખ્યાબંધ વાચકોએ ગૂગલ ઇમેજીસને કેવી રીતે પારખી શકે છે તે વિશે જાણવામાં રસ બતાવ્યો છે. જવાબ સવાલ જેટલો જ રસપ્રદ છે!
ગૂગલ, બિંગ કે યાહૂ જેવા કોઈ પણ સર્ચ એન્જિન લગભગ એકસરખા સિદ્ધાંતોને આધારે ઇન્ટરનેટ પર પથરાયેલી અસંખ્ય ઇમેજીસ સર્ચ કરે છે. અલબત્ત દરેક સર્ચ એન્જિન ઇમેજીસ સર્ચ કરવા માટે પોતપોતાના જરા જરા જુદા અલ્ગોરિધમ અને ટેક્નોલોજીનો ઉપયોગ કરે છે એટલે દરેકના પરિણામ વધતા ઓછા અંશે જુદા જુદા હોઈ શકે છે.
મશીનને કેવી રીતે ખબર પડે કે આ તસવીર મંદિરની છે અને બીજી તસવીર એ નામના કોઈ માણસની છે?
ગૂગલની વાત કરીએ તો જ્યારે આપણે સર્ચ બોક્સમાં કોઈ પણ શબ્દ લખીને તેની ઇમેજ સર્ચ કરવા માટે ઇમેજીસ પર ક્લિક કરીએ ત્યારે ગૂગલ આખા ઇન્ટરનેટ પર અસંખ્ય વેબપેજીસમાં રહેલી ઇમેજીસના તેણે તૈયાર કરેલા ડેટાબેઝ પર નજર દોડાવીને તેમાંથી આપણી સર્ચ ક્વેરીને સૌથી અનુરૂપ હોય એવી તસવીરો શોધીને ખરેખર આંખના પલકારામાં અસંખ્ય પરિણામો આપણી સામે ધરી દે છે.
આપણે ‘સોમનાથ’ શબ્દ લખીને સર્ચ કરીએ તો ગૂગલ સોમનાથ મંદિરની અસંખ્ય તસવીરો આપણી સામે ધરી દે છે. પરિણામો બતાવતા આ પેજને નીચેની તરફ સ્ક્રોલ કરતા જઈએ તો ક્યાંય સુધી, આપણી લોકસભાના સ્પીકર રહી ચૂકેલા નેતા સોમનાથ ચેટર્જીની એક પણ તસવીર જોવા મળતી નથી! બીજી તરફ, ‘સોમનાથ ચેટર્જી’ સર્ચ કરીએ તો તેનાં પરિણામોમાં ક્યાંય મંદિર જોવા મળતું નથી.
‘એ તો એમ જ હોયને!’ એવો વિચાર આવ્યો હોય તો ફરી વિચારજો. ગૂગલ કોઈ માણસ નથી. કમ્પ્યુટરને કેવી રીતે ખબર પડે છે કે ફક્ત ‘સોમનાથ’ સર્ચ કરવામાં આવ્યું હોય ત્યારે સર્ચ કરનાર વ્યક્તિ મંદિરની તસવીરો જોવાની અપેક્ષા રાખશે અને ‘સોમનાથ ચેટર્જી’ લખ્યું હોય ત્યારે તેને મંદિરમાં નહીં પણ એ નામની વ્યક્તિમાં રસ છે? ઉપરાંત, મશીનને કેવી રીતે ખબર પડે કે આ તસવીર મંદિરની છે અને બીજી તસવીર એ નામના કોઈ માણસની છે?
ઉપરાંત, આપણે ફક્ત સોમનાથ સર્ચ કરીએ ત્યારે મંદિરની તસવીરો ઉપરાંત સર્ચ એન્જિન આપણને સોમનાથનો દરિયાકાંઠો, જ્યોતિર્લિંગ લાઇવ દર્શન, શિવલિંગ વગેરેની તસવીરો પણ અલગ તારવીને, અલગ રીતે બતાવે છે.
આંખના પલકારમાં થતા આ ચમત્કાર ગૂગલ કે તેના જેવા સર્ચ એન્જિને, ઇન્ટરનેટ પરની અસંખ્ય તસવીરોના પહેલેથી તૈયાર કરેલા ડેટાબેઝને આધારે થાય છે.
ગૂગલ અને તેના જેવાં સર્ચ એન્જિન, ઇન્ટરનેટ પરની તસવીરો વિશેના તેના ડેટાબેઝને વિવિધ બાબતોને આધારે વધુ ને વધુ સમૃદ્ધ બનાવે છે. આની કેટલીક સાદી રીતે આ મુજબ છે…
આગળ શું વાંચશો?
- ઇમેજ વિશે માહિતી મેળવવાની સાદી રીતો
- ઇમેજ વિશે માહિતી મેળવવાની કેટલીક વધુ આધુનિક રીતો


ઇમેજ વિશે માહિતી મેળવવાની સાદી રીતો
- જો કોઈ તસવીર ડિજિટલ ફોર્મેટમાં લેવાઈને ઇન્ટરનેટ પર અપલોડ થઈ હોય તો તમામ ડિજિટલ કેમેરા અને સ્માર્ટફોન તેણે લીધેલી ડિજિટલ તસવીરમાં તસવીરની સાથોસાથ તેને સંબંધિત સંખ્યાબંધ વિગતો મેટાડેટા તરીકે સ્ટોર કરતા હોય છે. આવી ડિજિટલ તસવીર ઇન્ટરનેટ પર અપલોડ થાય ત્યારે આપણને નરી આંખે જે દેખાય છે તે તસવીર ઉપરાંત તેનો મેટાડેટા પણ ઇન્ટરનેટ પર અપલોડ થઈ જાય છે. ગૂગલ જેવા સર્ચ એન્જિન આ મેટાડેટાની વિગતો નોંધી રાખે છે.
- એ ઇમેજનું ઇન્ટરનેટ પર જે એડ્રેસ તૈયાર થયું હોય તે યુઆરએલ પણ ઇમેજ વિશે ગૂગલ જેવા સર્ચ એન્જિનને ઘણી બધી માહિતી આપી શકે છે. જો ડિજિટલ તસવીર લેનાર વ્યક્તિએ ઇમેજ ફાઇલનું નામ બદલ્યા વિના એને ઇન્ટરનેટ પર અપલોડ કરી હોય તો તેનું નામ IMG2043.jpg જેવું કંઈક હોઈ શકે છે.
- પરંતુ ઇમેજ અપલોડ કરનાર વ્યક્તિ ઇન્ટરનેટની રીતરસમોની જરા વધુ જાણકારી રાખતી હોય તો એ પોતાની ઇમેજને વધુ સર્ચેબલ બનાવવા માટે તેની ફાઇલનું નામ બદલીને somanath.jpg કે seashoresomnath.jpg કે sunsetinsomnath.jpg જેવું કરીને પછી તેને ઇન્ટરનેટ પર અપલોડ કરશે. આથી સર્ચ એન્જિનને એ ઇમેજ વિશે જરા વધુ જાણકારી મળી જશે (તસવીર સોમનાથની છે, વત્તા દરિયાકાંઠાની છે અથવા સૂર્યાસ્તની છે)!
- આ ઇમેજ જે પેજ પર હોય તે પેજના યુઆરએલને આધારે પણ સર્ચ એન્જિનને ઇમેજ વિશે જરા વધુ જાણકારી મળે છે.
- એ પેજ પરનું કન્ટેન્ટ સર્ચ એન્જિન વાંચી શકે છે આથી એ ઇમેજ અને તે જે પેજ પર હોય તેના પરના લખાણ પરનો તાળો મેળવીને પણ સર્ચ એન્જિન ઇમેજ વિશે ખાસ્સી જાણકારી મેળવે છે.
- એ પેજ પરનું બધું લખાણ ઇમેજના સંદર્ભમાં ઉપયોગી ન હોઈ શકે, પણ ફોટોની તરત નીચે આપેલું કેપ્શન ફોટોગ્રાફ વિશે સૌથી વધુ માહિતી આપી શકે.
- જો વેબપેજ પરની ઇમેજને કોઈ લિંક આપવામાં આવી હોય તો એ લિંક ક્યા વેબપેજ પર જાય છે અને એ વેબપેજ પર શું લખાણ છે તે ઇમેજ વિશે અંદાજ બાંધી આપે છે.
- સંખ્યાબંધ વેબસાઇટ એવી હોય છે જેમાં દૃષ્ટિની તકલીફ ધરાવતા મુલાકાતીઓ માટે ઇમેજની સાથોસાથ ઇમેજની વિગતો આપતું લખાણ પણ મૂકવામાં આવ્યું હોય છે જે મુલાકાતીઓ ટેક્સ્ટ ટુ સ્પીચ જેવી સગવડના આધારે સાંભળી શકે છે. સર્ચ એન્જિન દેખીતી રીતે આ વિગતો વાંચીને તેનાથી ઇમેજ વિશે વધુ જાણી શકીએ છીએ.

ઇમેજ વિશે માહિતી મેળવવાની કેટલીક વધુ આધુનિક રીતો
ઉપર લખી એ બધી વાતો ઇન્ટરનેટ પર ઇમેજ સંબંધિત જે કંઈ લખાણ હોય તેનો ઉપયોગ કરીને ઇમેજ સંબંધિત માહિતી એકઠી કરવાની જરા જૂની રીત છે.
પરંતુ હવે ટેકનોલોજી ઘણી આગળ વધી ગઈ છે અને સર્ચ એન્જિન ઇમેજ સંબંધિત લખાણ ઉપરાંત ખુદ ઇમેજને ‘જોઈ’ કે ‘સૂંઘી’ને તેના વિશે ઘણી બધી વધુ માહિતી મેળવી શકે છે. જેમ કે…
- આવી જુદી જુદી ઘણી પદ્ધતિઓમાંની એક છે ‘કેરેકટર રેકગ્નિનેશન ટેકનોલોજી’નો ઉપયોગ કરવો.
- દરેક ઇમેજ પર આ ટેકનોલોજીનો ઉપયોગ કરવાથી જો ઇમેજની અંદર કોઈ પણ શબ્દ હોય જે ઇમેજ સંબંધિત કંઈક વધુ જાણકારી આપતો હોય (આપણે આગળ લીધેલા ઉદાહરણનો જ ઉપયોગ કરીએ તો સોમનાથ મંદિરની ઇમેજમાં મંદિરનું નામ લખેલું બોર્ડ પણ જોવા મળતું હોય) તો સર્ચ એન્જિન આ બોર્ડમાંના અક્ષરો વાંચીને સમજી શકે છે કે આ તસવીર સોમનાથ મંદિર સંબંધિત હોવી જોઈએ.
- ફોટોગ્રાફમાં કોઈ વ્યક્તિએ લખાણવાળું ટીશર્ટ પહેર્યું હોય તો એ લખાણથી ફોટોગ્રાફ વિશે કોઈ માહિતી ન મળી શકે પણ એ વ્યક્તિની બાજુમાં કોઇ સ્ટ્રીટસાઇન જોવા મળતી હોય તો તેના આધારે એ તસવીરના લોકેશનની વધુ માહિતી મળી શકે છે.
- જો ડિજિટલ તસવીર લેનાર વ્યક્તિએ પોતાના સાધનમાં જિઓટેગિંગ ઓન રાખ્યું હોય તો સર્ચ એન્જિનને આ તસવીર પૃથ્વીના કયા સ્થળે લેવાઈ છે એ પણ તરત ખબર પડી જાય છે.
- તમે જાણતા જ હશો કે ગૂગલે આખી દુનિયાના સંખ્યાબંધ શહેરોની ગલી ગલીના સ્ટ્રીટ વ્યૂ તૈયાર કર્યા છે. એ માહિતી પણ તેને ઇમેજને ઓળખવામાં અત્યંત ઉપયોગી થાય છે.
- તસવીરમાં કોઈ પણ વિશ્વપ્રસિદ્ધ જાણીતું સ્થળ જોવા મળતું હોય તો તેને સર્ચ એન્જિન પારખી શકે છે. ટેકનોલોજી એટલી આગળ વધી ગઈ છે કે તાજમહેલ કે કૂતુબમિનાર જેવા લેન્ડમાર્કની જુદા જુદા અસંખ્ય એંગલથી તસવીર લેવાઈ હોય તો પણ સર્ચ એન્જિન તેને બરાબર પારખી શકે છે.
- એટલું જ નહીં, કોઈ એક તસવીરમાં કૂતુબ મિનાર દેખાતો હોય અને બીજી તસવીર, ત્યાર પછીના તરતના સમયે લેવાઈ હોય અને એમાં કુતુબ મિનાર દેખાતો ન હોય, પણ બંને તસવીરનો સ્રોત એક જ હોય તો પણ સર્ચ એન્જિન સમજી લે છે કે બીજી તસવીર પણ કૂતુબ મિનારની આસપાસની જ, દિલ્હીની હોવી જોઈએ.
- તમે ગૂગલ ફોટોઝ જેવી એપનો ઉપયોગ કરતા હો તો તેમાં જોયું હશે કે આ એપ તમારા પરિવારના દરેક સભ્યોના ચહેરા ઓળખી શકે છે અને જેટલા ફોટોગ્રાફમાં એ વ્યક્તિ દેખાતી હોય એ તમામ ફોટોગ્રાફને અલગ તારવી શકે છે (અલબત્ત તમારા પોતાના સિવાય આ તસવીરો અન્ય કોઈ જોઈ શકતું નથી અને આ તસવીરો પબ્લિક સર્ચ રીઝલ્ટમાં જોવા મળતી નથી).
- આમ સર્ચ એન્જિન જુદી જુદી રીતે ઘણી બધી રીતે એક ઇમેજ સંબંધિત વિવિધ પ્રકારની માહિતીનો રેકોર્ડ સાચવે છે. અને તેના આધારે એ તસવીર શાની હોવી જોઈએ તેનો તે અંદાજ બાંધે છે.
- જ્યારે આપણે કોઈ શબ્દ સર્ચ એન્જિનમાં સર્ચ કરીએ અને તેને મળતાં પરિણામો પર ક્લિક કરીએ એ રેકોર્ડ પર પણ નજર રાખીને સર્ચ એન્જિન જે તે ઇમેજ વિશેના તેના રેકોર્ડમાં સુધારો વધારો કરતું રહે છે. જેમ કે, ‘સોમનાથ’ શબ્દ સર્ચ કરવાથી જોવા મળતી જે ઇમેજો પર વધુ લોકોએ ક્લિક કરી હોય એ ઇમેજ સોમનાથની જ હોવાની સર્ચ એન્જિનને વધુ ને વધુ ખાતરી થાય છે. આથી એ ઇમેજના સ્કોરિંગને આગળ લઈ જાય છે. જ્યારે જે તસવીરો પર ઓછી ક્લિક થતી હોય તેને તે નવેસરથી ચકાસે છે.
- આપણે જ્યારે સર્ચ એન્જિનને કોઈ પણ ઇમેજ શોધવાનું કહીએ ત્યારે આપણી પોતાની ભાષાનો ઉપયોગ કરતા હોઇએ છીએ. જેમ કે, “Books written by Zaverchand Meghani”. સર્ચ એન્જિને આપણી આ નેચરલ ભાષાને કમ્પ્યુટર સિસ્ટમને સમજાય તેવા શબ્દોમાં ફેરવવી પડે છે. એ પછી એ સર્ચ ક્વેરીમાં રહેલા શબ્દો સાથે સૌથી વધુ મેળ બેસતો હોય તેવી તસવીરો સર્ચ એન્જિન પોતાના રેકર્ડમાંથી શોધે છે. ત્યાર પછી જે તસવીરોની યાદી તૈયાર થાય તેનું ઉપર કહ્યા મુજબ સ્કોરિંગ તપાસવામાં આવે છે અને તેના આધારે સર્ચ રિઝલ્ટના લિસ્ટમાં કઈ તસવીર ઉપર બતાવવી તે નક્કી કરવામાં આવે છે.
- ગૂગલની વાત કરીએ તો ગૂગલ શબ્દોના તાળા મેળવવા ઉપરાંત લેન્ડમાર્ક રેકગ્નિનેશન, ઓપ્ટિકલ કેરેકટર રેકગ્નિનેશન, ફેસ રેકગ્નિનેશનમાટે અલગ અલગ અસંખ્ય પ્રકારના અલ્ગોરિધમ અને ડેટા સ્ટ્રકચરનો ઉપયોગ કરે છે અને હવે તેમાં આર્ટિફિશિયલ ઇન્ટેલિજન્સનો એન્ગલ પણ ઉમેરાયો છે. ગૂગલ આમાંની ઘણી ટેકનોલોજી વિશે ઘણી વાતો જાહેર કરે છે પણ ઘણી વાતો તે આપણાથી ખાનગી પણ રાખે છે!
આ આખી વાતમાં ખરેખર મજાનો એંગલ એ પણ છે આપણે સર્ચ એન્જિનમાં કંઈક લખીએ ત્યાર પછી એટલી બધી ઝડપથી, તેના પરિણામ સ્વરૂપ તસવીરો આપણી સમક્ષ આવી જાય છે કે આપણને એ વિચારવાનો સમય પણ રહેતો નથી કે આ કરામત થઈ કેવી રીતે? ટેકનોલોજીની એ જ તો મજા છે!

