ಇದೊಂದು ತಾಂತ್ರಿಕ ಮಾಹಿತಿ ಗೊತ್ತಿದ್ದರೆ ಅನುಕೂಲ, ಆಸ್ಕಿ ಮತ್ತು ಯುನಿಕೋಡ್ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು? ಮಧು ವೈಎನ್ ಬರಹ
ಆಸ್ಕಿ ಮತ್ತು ಯುನಿಕೋಡ್ ನಡುವಿನ ವ್ಯತ್ಯಾಸ ಏನು ಎಂಬುದರ ಕುರಿತು ಮಧು ವೈಎನ್ ಎನ್ನುವವರು ತಮ್ಮ ಫೇಸ್ಬುಕ್ನಲ್ಲಿ ಪೋಸ್ಟ್ ಹಂಚಿಕೊಂಡಿದ್ದು, ಕನ್ನಡಿಗರಿಗೆ ಇದೊಂದು ತಾಂತ್ರಿಕ ಮಾಹಿತಿ ಗೊತ್ತಿದ್ದರೆ ಅನುಕೂಲವಾಗಲಿದೆ ಎಂದು ತಿಳಿಸಿದ್ದಾರೆ.

ಒಂದಾನೊಂದು ಕಾಲದಲ್ಲಿ(1960s) ಕಂಪ್ಯೂಟರ್ ಮೊದಲ ಸಲ ಜಗತ್ತಿಗೆ ಕಾಲಿಟ್ಟಾಗ ಆಗಿನ್ನೂ ಅದು ಎಳಸು ಇದ್ದು ಆಗಿನ ಅಗತ್ಯ ಅದಕ್ಕೆ ಕೇವಲ ಇಂಗ್ಲೀಷನ್ನು ಮಾತ್ರ ಅರ್ಥ ಮಾಡಿಸುವುದಾಗಿದ್ದು ಮತ್ತು ಅದಕ್ಕೆ ಕೇವಲ ಒಂದು-ಸೊನ್ನೆ (ಬಿಟ್) ಅರ್ಥವಾಗುತ್ತಿದ್ದರಿಂದ ಇಂಗ್ಲೀಷನ್ನು ಬಿಟ್ಗೆ ಭಾಷಾಂತರ ಮಾಡುವ ಅನಿವಾರ್ಯತೆ ಸೃಷ್ಟಿಯಾಗಿತ್ತು. ಅದಕ್ಕಾಗಿ 7 ಬಿಟ್ಗಳನ್ನು ನಿಗದಿ ಮಾಡಲಾಯಿತು. ಆಗಿನ ಕಂಪ್ಯೂಟರಿನ ಶಕ್ತಿ ಎಂಟು ಬಿಟ್ಗಳಾಗಿದ್ದು ಎಂಟನೆಯ ಬಿಟ್ಅನ್ನು ಎರರ್ ಚೆಕಿಂಗಿಗೆ ಎತ್ತಿಡಲಾಗಿತ್ತು. (ಗಮನಿಸಿ: ನಮ್ಮ ಈಗಿನ ಕಂಪ್ಯೂಟರ್ಸ್ 64 ಬಿಟ್ ಶಕ್ತಿಶಾಲಿಯಾಗಿವೆ).
ಮನುಷ್ಯನ ಸಂಖ್ಯಾಶಾಸ್ತ್ರದಲ್ಲಿ 0-9 ಅಂದರೆ ಒಟ್ಟು 10 ಸಂಖ್ಯೆಗಳು ಇದಾವೆ. ಇದಕ್ಕಿಂತ ಜಾಸ್ತಿ ಬೇಕಂದರೆ ಎರಡು ಸಂಖ್ಯೆಗಳನ್ನು ಅಕ್ಕಪಕ್ಕ ಜೋಡಿಸಿಬೇಕು. ಹಾಗೆ ಮಾಡಿದಾಗ ನಮಗೆ 00-99 ಅಂದರೆ ಒಟ್ಟು ನೂರು ಸಂಖ್ಯೆಗಳು ಸಿಗುತ್ತವೆ. ಅದೇ ರೀತಿ 7 ಬಿಟ್ಗಳನ್ನು ಅಕ್ಕಪಕ್ಕ ಜೋಡಿಸಿದಾಗ ನಮಗೆ 128 ಸಂಖ್ಯೆಗಳು ಅಥವಾ ಕೋಡ್ಗಳು ದೊರೆಯುತ್ತವೆ. ಇಂಗ್ಲೀಷಿನ A-Z, a-z, 0-9, . , ? ! @ # ಹಾಳುಮೂಳು ಸೇರಿ ಒಟ್ಟು ನೂರಿಪ್ಪತ್ತೆಂಟು ಮನುಷ್ಯ ಭಾಷೆಯ ಚಿನ್ಹೆಗಳನ್ನು ನೂರಿಪ್ಪತ್ತೆಂಟು ಕೋಡ್ಗಳಿಗೆ ನಿಗದಿ ಮಾಡಿ ಮೊದಲ ಸಲ ಮನುಷ್ಯ ಭಾಷೆಯನ್ನು ಕಂಪ್ಯೂಟರಿಗೆ ಭಾಷಾಂತರಿಸಿ ಅರ್ಥ ಮಾಡಿಸಲಾಯಿತು. ಇದೇ ಮತ್ತು ಇಷ್ಟೇ ಆಸ್ಕಿ ಕೋಡ್. ಉದಾಹರಣೆಗೆ ಇಂಗ್ಲೀಷಿನ ಅಕ್ಷರ A ಗೆ ನಿಗದಿಯಾಗಿರುವುದು 65ನೇ ಆಸ್ಕಿ ಕೋಡ್ (01000001).
ಸರಿ ಇರುವ 128 ಸಂಖ್ಯೆಗಳನ್ನು ಬರೀ ಇಂಗ್ಲೀಷಿಗೆ ಖರ್ಚು ಮಾಡಿಬಿಟ್ಟರೆ ಉಳಿದ ಭಾಷೆಗಳು ಏನು ಮಾಡಬೇಕು? ಹೊಸ ಕೋಡ್ಗಳು ಬೇಕು. ಅಂದರೆ ಇನ್ನಷ್ಟು ಒಂದು-ಸೊನ್ನೆಗಳನ್ನು ಬಳಸಬೇಕು. ಹೀಗೆ ಯೋಚಿಸಿದಾಗ ಹುಟ್ಟಿದ್ದೇ ಯೂನಿವರ್ಸಲ್ ಕ್ಯಾರಕ್ಟರ್ ಎಂಕೋಡಿಂಗ್ (ಯೂನಿಕೋಡ್).
ಯುನಿಕೋಡ್ನಿಂದ ಗಜಿಬಿಜಿ
ನಮ್ಮಲ್ಲಿ ಮೂರು ಸಂಖ್ಯೆಗಳನ್ನು ಅಕ್ಕಪಕ್ಕ ಇಟ್ಟರೆ 000-999 ಒಟ್ಟು ಸಾವಿರ ಸಂಖ್ಯೆಗಳು ಸಿಗುತ್ತವಲ್ವ ಹಾಗೆ ಯುನಿಕೋಡಿನಲ್ಲಿ ಎಂಟರ ಬದಲಾಗಿ ಹದಿನಾರು ಬಿಟ್ಗಳನ್ನು ಎತ್ತಿಟ್ಟರು. ಇದರಿಂದಾಗಿ ಏಕ್ದಂ 65 ಸಾವಿರ ಹೊಸ ಕೋಡ್ಗಳು ಸಿಕ್ಕಂತಾಯಿತು. ಯಾವುದಕ್ಕೂ ಇರಲಿ ಎಂದು ಹೆಚ್ಚುವರಿಯಾಗಿ ಇನ್ನು ಹದಿನಾರು ಬಿಟ್ ಎತ್ತಿಟ್ಟಿದ್ದರು. ಮೊದಲ ಹದಿನಾರು ಬಿಟ್ ಬಳಸಿಕೊಂಡು ಪ್ರತಿ ಭಾಷೆಯ ಪ್ರತಿ ಅಕ್ಷರಕ್ಕೆ ಹೊಸ ಕೋಡ್ ಕೊಡುತ್ತಾ ಹೋದರು. ಆಗ ಏನಾಯಿತೆಂದರೆ ಅಲ್ಲಿ ತನಕ ಆಸ್ಕಿ ಬಳಸುತ್ತಿದ್ದವರೆಲ್ಲ ನಿಮ್ಮ ಯುನಿಕೋಡ್ನಿಂದಾಗಿ ನಮ್ಮ ಹಳೆಯ ಬರಹವೆಲ್ಲಾ ಗಜಿಬಿಜಿಯಾಗುತ್ತಿದೆ ಎಂದು ಬಾಯಿ ಬಡಿದುಕೊಂಡರು.
ತಂತ್ರಜ್ಞರು ‘ಅರರೆ ನಮ್ಮ ಪೂರ್ವಿಕರ ಕಷ್ಟವನ್ನೂ ಆಲಿಸಬೇಕಲ್ಲಾ’ ಎಂದು ಮನಸು ಬದಲಾಯಿಸಿ ಯುನಿಕೋಡಿನ ಮೊದಲ 128 ಕೋಡುಗಳನ್ನು ಮೂಲ ಆಸ್ಕಿಯಲ್ಲಿದ್ದಂತೆಯೇ ಇಂಗ್ಲೀಷಿಗೆ ನಿಗದಿ ಮಾಡಿದರು. ಮೊದಲು ತಂದದ್ದು UTF-16 ಎಂದು ಕರೆದರು. ಆಸ್ಕಿ ಗೋಳಾಟಕ್ಕಾಗಿ ತಿದ್ದುಪಡಿ ಮಾಡಿದ್ದನ್ನು UTF-8 ಎಂದು ಕರೆದರು. ಆದ್ದರಿಂದಲೇ ಗಮನಿಸಿದ್ದಲ್ಲಿ ನಿಮ್ಮ ವರ್ಡ್ ಫೈಲಿನಲ್ಲಿ ಆಸ್ಕಿಯಿಂದ ಯೂನಿಕೋಡಿಗೆ ಅಥವಾ ಯುನಿಕೋಡಿಂದ ಆಸ್ಕಿಗೆ ಬದಲಾಯಿಸಿದಾಗ ಕನ್ನಡ ಅಕ್ಷರಗಳು ಗಜಿಬಿಜಿಯಾಗುತ್ತವೇ ವಿನಾ ಇಂಗ್ಲೀಷಿನದು ಅಲ್ಲ. ಇದು ಯಾಕಂದರೆ ಡೀಫಾಲ್ಟ್ ಯೂನಿಕೋಡ್ UTF-8 ಸೆಟ್ ಆಗಿರುತ್ತದೆ.
ಇದರ ನಂತರ ಇನ್ನೂ ಒಂದು ಹೊಸ ಸಮಸ್ಯೆ ಹುಟ್ಟಿಕೊಂಡಿತು. ಆಗಲೇ ಹೇಳಿದಂತೆ ಮೂರು ಸಂಖ್ಯೆಗಳನ್ನು ಜೋಡಿಸಿದರೆ ಒಟ್ಟು ಸಾವಿರ ಸಂಖ್ಯೆಗಳು ಸಿಗುತ್ತವೆ ಎಂದೆನಲ್ಲಾ ಅದರಲ್ಲಿ ನೀವು 99 ಸಂಖ್ಯೆಯನ್ನು 099 ಎಂದು ಬರೆಯೋದಿಲ್ಲ ಅಲ್ಲವಾ? UTF-8ನಲ್ಲಿಯೂ ಹಾಗೇ ಆರಂಭದಲ್ಲಿ ಬರುವ ಇಂಗ್ಲೀಷಿನ ಅಕ್ಷರಗಳನ್ನು 8 ಬಿಟ್ಗಳಲ್ಲಿ ಬರೆದು ಮುಗಿಸಿಬಿಡುತ್ತಿದ್ದರು. ಕನ್ನಡದಂಥ ಅಕ್ಷರಗಳಿಗೆ ಮಾತ್ರ ಹೆಚ್ಚಿನ ಬಿಟ್ಗಳನ್ನು ಬಳಸುತ್ತಿದ್ದರು. ಕಂಪ್ಯೂಟರಿನ ಕೆಲವು ಕಡೆ ಇದು ತೊಂದರೆ ಕೊಡಲಾರಂಭಿಸಿತು. ಅಂದ್ರೆ 999 ಎಂಬುದನ್ನು 9 ಮತ್ತು 99 ಎಂದೂ ಓದಬಹುದಲ್ಲ, ಅಂತಹ ಗೊಂದಲ. ಆದ್ದರಿಂದ ಎಲ್ಲಾ ಅಕ್ಷರಗಳಿಗೂ ಕಡ್ಡಾಯವಾಗಿ 32 ಒಂದು-ಸೊನ್ನೆಗಳನ್ನು ಬಳಸಲೇಬೇಕು ಎಂಬ ನಿಯಮ ಹೊರಡಿಸಿದರು. ಅಂತಹ ನಿಯಮ ಹೊತ್ತ ಎಂಕೋಡಿಂಗ್ ಅನ್ನು UTF-32 ಎಂದು ಕರೆದರು.
ಆದರೆ ಜನ ಇದನ್ನು ಎರಡೂ ತೋಳು ಅಗಲಿಸಿ ಬಾಚಿ ತಬ್ಬಿಕೊಳ್ಳಲಿಲ್ಲ. ಯಾಕಂದರೆ ಒಂದು ಬೈಟ್ ಜಾಗದಲ್ಲಿ ನಾಲ್ಕು ಬೈಟ್ ಬಳಸಿ ಸುಮ್ಮನೇ ಮೂರು ಬೈಟ್ ದಂಡ ಮಾಡುವುದು ಸಮಂಜಸ ಅನ್ನಿಸಲಿಲ್ಲ. ಉದಾಹರಣೆಗೆ ಒಂದು ಮೆಗಾ ಬೈಟ್ ಸೈಜಿನ ವರ್ಡ್ ಫೈಲನ್ನು ಸುಮ್ಮ ಸುಮ್ಮನೇ ನಾಲ್ಕು ಮೆಗಾ ಬೈಟ್ ಸೈಜ್ಗೆ ಏರಿಸಿದರೆ ಇಂಟರ್ನೆಟ್ ಸ್ಪೀಡು ದಂಡ ಅನಿಸುವುದಿಲ್ಲವೇ? ಹಾಗಾಗಿ ಇಂದು ಜಗತ್ತಿನಾದ್ಯಂತ ಯೂನಿಕೋಡ್, ಅದರಲ್ಲಿಯೂ UTF-8 ಮಾತ್ರ ವ್ಯಾಪಕ ಬಳಕೆಯಲ್ಲಿದೆ. ನೀವು ಏನು ಮಾಡ್ತಿದ್ದೀರಿ ಎಂದು ನಿಮಗೆ ಗೊತ್ತಿದ್ದರೆ ಮಾತ್ರ UTF-16 ಅಥವಾ UTF-32 ಬಳಸಬಹುದಾಗಿದೆ.
ಆಸ್ಕಿ ಬಳಸುತ್ತಿದಾರೆ ಎಂಬುದು ಆಶ್ಚರ್ಯ
ಆರಂಭದಲ್ಲಿ ಹೇಳಿದಂತೆ ಕಂಪ್ಯೂಟರು ಹುಟ್ಟಿದಾಗ ಶುರುವಾತಿನಲ್ಲಿ ಆಸ್ಕಿ ವ್ಯವಸ್ಥೆ ಇತ್ತು. ಮೊಬೈಲ್ಗಳು ಬರುವಷ್ಟರಲ್ಲಿ ಯುನಿಕೋಡ್ ಬಂದಾಗಿತ್ತು. ಆದ್ದರಿಂದಲೇ ನೀವು ಬರಹ ನುಡಿ ಮುಂತಾದ್ದು ಬಳಸಿ ಆಸ್ಕಿ ಕೋಡಿನಲ್ಲಿ ಬರೆದ ಕನ್ನಡವನ್ನು ಮೊಬೈಲಿನಲ್ಲಿ ತೆರೆಯಲಾಗಲ್ಲ. ಯಾಕಂದರೆ ಮೊಬೈಲಿಗೆ ಆ ಕೋಡ್ವರ್ಡ್ಗಳು ಅರ್ಥವಾಗಲ್ಲ. ಇಷ್ಟು ಅರ್ಥವಾಗಿದ್ದಲ್ಲಿ ಅಕಸ್ಮಾತ್ ನಿಮ್ಮ ಕಣ್ಣಿಗೆ ‘ಅರೆ ಈ ಕನ್ನಡ ಅಕ್ಷರ ಕಂಪ್ಯೂಟರಿನಲ್ಲಿ ಇಲ್ಲವಲ್ಲಪ್ಪ’ ಅನಿಸಿದರೆ ಅಗತ್ಯವಾಗಿ ಅದನ್ನು ಯೂನಿಕೋಡ್ ಸಂಸ್ಥೆಯ ಗಮನಕ್ಕೆ ತರಬಹುದು. ಅವರು ಅದಕ್ಕೆ ಒಂದು ಕೋಡ್ ನಿಗದಿ ಮಾಡುತ್ತಾರೆ. ಆನಂತರ ಫಾಂಟ್ ಡೆವಲಪ್ ಮಾಡುವವರು ಹೊಸ ಅಕ್ಷರವನ್ನು ವಿನ್ಯಾಸ ಮಾಡಿ ನಿಗದಿಯಾಗಿರುವ ಯೂನಿಕೋಡ್ ಸೆಟ್ ಮಾಡಿ ತಮ್ಮ ಫಾಂಟಿನಲ್ಲಿ ಸೇರಿಸಬೇಕಾಗುತ್ತದೆ. (ಕನ್ನಡದ ದಿನಪತ್ರಿಕೆಗಳು ಪುಸ್ತಕ ಮುದ್ರಕರು ಇನ್ನು ಆಸ್ಕಿ ಬಳಸುತ್ತಿದಾರೆ ಎಂಬುದು ಆಶ್ಚರ್ಯ, ವಿಸ್ಮಯ, ಬೆರಗಿನ ಸಂಗತಿ).
ಗಮನಕ್ಕೆ: ಮಧು ವೈಎನ್ ಅವರ ಫೇಸ್ಬುಕ್ ಫೋಸ್ಟ್ ಅನ್ನು ಯಥಾವತ್ತಾಗಿ ಪ್ರಕಟಿಸಲಾಗಿದೆ.
