પ્રજ્ઞાચક્ષુઓ માટે તસવીરોનું વર્ણન કરી આપતી ટેક્નોલોજી

૦૯૫, જાન્યુઆરી ૨૦૨૦, CyberSafar-2020-Issues

પ્રજ્ઞાચક્ષુઓ માટે તસવીરોનું વર્ણન કરી આપતી ટેક્નોલોજી

By Himanshu Kikani

આ પ્રકારના વધુ લેખઃ Browsers, Google Chrome

પ્રજ્ઞાચક્ષુઓની સુવિધા માટે સ્ક્રીન રીડર સોફ્ટવેર વેબપેજનું લખાણ વાંચી સંભળવતા હોય છે. આ સોફ્ટવેર ઇમેજનું વર્ણન – જો વેબપેજ ડેવલપરે આપ્યું ન હોય તો – કરી શકતા નથી. આ ઉણપ પૂરી કરે છે નવી ટેક્નોલોજી.

જે વ્યક્તિને કંઈ દેખાતું ન હોય એને માટે આપણી ભાષામાં એક સરસ શબ્દ છે – પ્રજ્ઞાચક્ષુ.

પ્રજ્ઞાચક્ષુ એટલે એવી વ્યક્તિ જે અન્ય વ્યક્તિઓની જેમ સાદી આંખથી નહીં પરંતુ પોતાની પ્રજ્ઞા એટલે કે આંતરિક શક્તિથી આસપાસની દુનિયા ‘જોઈ’ શકે છે. આવી વ્યક્તિની અંદર કુદરત કંઈક એવી શક્તિ મૂકે છે જેને કારણે તે પોતાને જે દેખાતું નથી એની પણ સમજ મેળવી શકે છે.

તમને જાણીને કદાચ નવાઈ લાગશે કે આપણને ઇન્ટરનેટની જુદી જુદી વેબસાઇટ્સ બતાવતાં જુદાં જુદાં બ્રાઉઝર્સ પણ એક અર્થમાં હવે ‘પ્રજ્ઞાચક્ષુ’ બની રહ્યાં છે!

કોઈ પણ વેબ પેજ પર પહોંચતાં તેના પરની વિવિધ ઇમેજિસ આપણને જેવી દેખાય છે તેવી બ્રાઉઝરને દેખાતી હોતી નથી. તેને તો જો વેબ ડેવલપરે એ ઇમેજમાં શું છે તે દર્શાવતી માહિતી આપી હોય એ જ દેખાય છે.

આખી વાતમાં રસપ્રદ વળાંક અહીંથી જ આવે છે.

આ ઇમેજનું મશીનથી જનરેટ થયેલું વર્ણનઃ “Appears to be: Fruits and vegetables at the market.” એટલે કે ‘‘જણાય છે કેઃ બજારમાં ફળો અને શાકભાજીઓ.’’

તમે જાણતા હશો કે અપૂરતી દૃષ્ટિ કે દૃષ્ટિનો સદંતર અભાવ ધરાવતી વ્યક્તિ પણ ઇન્ટરનેટનો ઉપયોગ કરતી હોય છે. તેમને સ્ક્રીન રીડર્સ જેવી સુવિધા ઉપયોગી થતી હોય છે. તમે કદાચ એ પણ જાણતા હશો કે લગભગ બધી જ સરકારી વેબસાઇટ્સ પર સ્ક્રીન રીડરની સુવિધા આપવી વેબ ડેવલપર માટે ફરજિયાત હોય છે, જેથી દિવ્યાંગ વ્યક્તિઓ પણ તેનો પૂરતો લાભ લઈ શકે.

ઇન્ટરનેટ પર જ્યારે કોઈ વ્યક્તિ આવા સ્ક્રીન રીડરની મદદથી કોઈ વેબપેજ ‘જોઈ’ રહી હોય ત્યારે સ્ક્રીન પરનું લખાણ સ્ક્રીન રીડર સોફ્ટવેર એ વ્યક્તિને વાંચી સંભળાવે છે. જ્યારે લખાણમાં કોઈ ઇમેજ કે વીડિયો કે ઓડિયો વગેરે ટેક્સ્ટ સિવાયનો ભાગ આવે ત્યારે સ્ક્રીન રીડર સોફ્ટવેર, એ મીડિયા માટે વેબડેવલપરે જે ડેટા આપ્યો હોય તે વાંચી સંભળાવે છે.

ટેકનિકલ ભાષામાં આવા ડેટાને ‘ઓલ્ટ ટેક્સ્ટ’ અથવા ‘ઓલ્ટ એટ્રિબ્યુટ્સ’ કહેવામાં આવે છે. પરંતુ તકલીફ ત્યારે થાય છે જ્યારે વેબ ડેવલપરે પૂરતી કાળજી લઈને વેબપેજમાં મૂકેલા દરેક મીડિયા માટે યોગ્ય રીતે ઓલ્ટ ટેકસ્ટ મૂકી ન હોય.

આથી સ્ક્રીન રીડર એવી કોઈ ઇમેજ પાસે પહોંચે જેની યોગ્ય ઓલ્ટ ટેક્સ્ટ ન હોય ત્યારે તે એ ઇમેજ માટે ‘ઇમેજ’ અથવા ‘અનલેબલ્ડ ગ્રાફિક’ જેવું કંઈક બોલે છે અથવા પછી ઇમેજનું લાંબું લચક ફાઇલનેમ વાંચી સંભળાવે છે. જે સાંભળવાથી પ્રજ્ઞાચક્ષુ વ્યક્તિને એ ઇમેજ વિશે કોઈ સમજ મળતી નથી!

ઇન્ટરનેટ પર લાખો કરોડો ઇમેજિસ એવી છે, જેના માટે ઓલ્ટ ટેકસ્ટ રૂપે યોગ્ય સમજ આપવામાં આવી નથી. નિષ્ણાતોએ આ સ્થિતિનો ઉપાય પણ શોધી કાઢ્યો છે.

ઇન્ટરનેટ પર આવી તો લાખો કરોડો ઇમેજિસ છે, જેના માટે ઓલ્ટ ટેકસ્ટ રૂપે યોગ્ય સમજ આપવામાં આવી નથી.

ટેકનોલોજીના નિષ્ણાતોએ આ સ્થિતિનો ઉપાય પણ શોધી કાઢ્યો છે. હવે પછી જ્યારે કોઈ પ્રજ્ઞાચક્ષુ વ્યક્તિ ગૂગલ ક્રોમ બ્રાઉઝરમાં સ્ક્રીન રીડર સુવિધાનો ઉપયોગ કરી રહી હોય અને એ દરમિયાન બ્રાઉઝરને કોઈ વેબપેજ પર એવી ઇમેજ કે ગ્રાફિક મળે જેનું સ્પષ્ટ વર્ણન આપવામાં આવ્યું ન હોય તો ક્રોમ બ્રાઉઝર પોતાની રીતે એ ઇમેજનું વર્ણન ઉમેરી આપે છે!

આ ઇમેજનું મશીનથી જનરેટ થયેલું વર્ણનઃ “Appears to be: Person playing guitar on the sofa.” એટલે કે ‘‘જણાય છે કેઃ સોફા પર ગિટાર વગાડી રહેલી વ્યક્તિ.’’

ગૂગલ સ્પષ્ટતા કરે છે કે કમ્પ્યુટર દ્વારા ઓટોમેટિક રીતે જનરેટ કરવામાં આવતું ઇમેજનું વર્ણન કોઈ જીવતા જાગતા માણસે આપેલા વર્ણન કે સંદર્ભ જેટલું સચોટ ન હોઈ શકે, પરંતુ હાલના અભ્યાસો બતાવે છે કે કમ્પ્યુટર ખાસ્સી સચોટ રીતે અને પ્રજ્ઞાચક્ષુ વ્યક્તિને મદદરૂપ થઈ શકે એવી રીતે ઇમેજનું વર્ણન કરી આપે છે.

જ્યારે સ્ક્રીન રીડરનો ઉપયોગ કરતી વ્યક્તિ ક્રોમના સેટિંગ્સમાં જઇને ઇમેજનું ઓટોમેટિક ડિસ્ક્રિપ્શન કરવામાં આવે એવું સેટિંગ પસંદ કરે તો અને ત્યારે જ ક્રોમમાંની વર્ણન વગરની ઇમેજ સલામત રીતે ગૂગલના સર્વર પર મોકલવામાં આવે છે.

અહીં વિવિધ પ્રકારનાં મશીન લર્નિંગ મોડેલ્સની મદદથી એ ઇમેજની શક્ય એટલી માહિતી મેળવવાનો પ્રયાસ કરવામાં આવે છે. જેમ કે ઇમેજમાં કોઈ સ્પષ્ટ લખાણ દેખાઈ રહ્યું હોય, લેબલ હોય, કે હાથેથી લખેલા શબ્દો હોય તો એ ઓળખવાનો પ્રયાસ થાય છે. અન્ય મશીન લર્નિંગ મોડેલ્સથી ઇમેજમાં દેખાઈ રહેલી વિવિધ ચીજવસ્તુ ઓળખવાનો પ્રયાસ થાય છે. (એટલે જ, ગૂગલ ફોટોઝમાં આપણે કોઈ માહિતી આપી હોય તો પણ એપ જુદી જુદી ચીજવસ્તુ કે વ્યક્તિ, ઇમારતના ફોટા ઓળખી લે છે).

મજા એ વાતની છે કે જ્યારે કમ્પ્યુટરની સિસ્ટમને પૂરો વિશ્વાસ હોય કે ઇમેજનું આપોઆપ તૈયાર થયેલું વર્ણન સાચું છે ત્યારે જ તે ઇમેજમાં ઉમેરવામાં આવે છે.

છેવટે આ બધાનો તાળો મેળવીને એક સળંગ વાક્ય સ્વરૂપે એ ઇમેજમાં શું છે તે લખવામાં આવે છે!

વાત આટલેથી પૂરી થતી નથી. આટલું થયા પછી જે ઓટોમેટિક રીતે જે વાક્ય તૈયાર થયું છે એ કેટલું સચોટ છે, તે ઇમેજનું બરાબર વર્ણન કરે છે કે કેમ, આ વર્ણન ઉપયોગી છે કે કેમ વગેરે બાબતો ફરીથી મશીન લર્નિંગ સિસ્ટમમાં ફીડ કરવામાં આવે છે અને તેને આધારે ઇમેજના વર્ણનને વધુ સચોટ બનાવવાનો પ્રયાસ થાય છે.

મજા એ વાતની છે કે જ્યારે કમ્પ્યુટરની સિસ્ટમને પૂરો વિશ્વાસ હોય કે ઇમેજનું વર્ણન સાચું છે ત્યારે જ ઇમેજમાં ઉમેરવામાં આવે છે.

આ ટેકનોલોજીની મદદથી જેનું કોઈ વર્ણન આપવામાં આવ્યું ન હોય એવી ઇમેજ વિશે ઓટોમેટિકલી – બરાબર ધ્યાન આપજો – આપોઆપ એ ઇમેજનું વર્ણન કરતાં કેવાં વાક્યો તૈયાર થાય છે તેના ઉદાહરણ આ લેખ સાથેની ઇમેજમાં જોઈ લો!

આપના અભિપ્રાય

Latest Issue

All Issues

Mini-Guides

લવાજમ દિવાળી ઓફર

પ્રજ્ઞાચક્ષુઓ માટે તસવીરોનું વર્ણન કરી આપતી ટેક્નોલોજી

Leave a Reply Cancel reply

વેબસાઇટમાં ફેરફાર કરવામાં આવી રહ્યા છે. થોડો સમય અગવડતા બદલ માફ કરશો!

સાઇટમાં વેબ લેઆઉટ

એપમાં પ્રિન્ટ લેઆઉટ

About & Policies

વેબસાઇટમાં ફેરફાર કરવામાં આવી રહ્યા છે. થોડો સમય અગવડતા બદલ માફ કરશો!