בינלאומי, לוקליזציה, קידוד, איסלנד ותרגום אתר צילום חתולים יפני

תרגום בינלאומי

בינאוםThere's a lot of information out there when it comes to internationalization, localization and encoding within web applications. There's also a lot of misunderstanding about what each provides for a web application. Here's my take…

When a web browser makes a connection to a web server, it passes quite a few variables and makes additional requests, here's an example:

GET / HTTP / 1.1
מארח: www.dknewmedia.com
User-Agent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
קבל: HTTP קבל = טקסט / xml, יישום / xml, יישום / xhtml + xml, טקסט / html; q = 0.9, טקסט / רגיל; q = 0.8, תמונה / png, * / *; q = 0.5
קבל שפה: en-us, en; q = 0.5
קבל קידוד: gzip, לנפח
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

בינאום

בינאום הוא מרכיב של הרבה דברים:

  1. לוקליזציה: The ability to identify what language and location a visitor is visiting from. This is done through HTTP Requests where the visitor is identified by a locale. In my case, that's en-US. “en” is English and “US” is the United States. This is a setting within my Operating System.
  2. אזורי זמן: היכולת להסתגל לאזורי זמן. זה נעשה בדרך כלל על ידי הגדרת השרת שלך לממוצע זמן גריניץ '(GMT) ואז מתן אפשרות למשתמשים לקבוע את הקיזוז המקומי שלהם מ- GMT.
  3. קידוד תווים: This is the ability to display language character sets properly. It's different from localization since localization can tell me the language and region of the computer that is making the request from, but it won't tell me what language the קורא is requesting… that's up to the reader!

שים לב בכותרת ה- HTTP שלי כאשר הדפדפן הגיש את הבקשה, הוא אמר לשרת שהוא מבקש את המקום שלי (Accept-Language: en-us); עם זאת, הוא גם צריך לספר לשרת איזה ערכת תווים מתבקשת (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 ו- utf -8 הן ערכות תווים מותרות.

לוקליזציה

In this fantastic mixed-up world, localization never dictates language anymore. Even though I'm in en-US, I can absolutely read a different language using a different character set… that's what happens when I use גוגל הינדי (I don't really use Google Hindi). My request for locale and character set are identical as when I request the גוגל אנגלית page, but I'm actually fed a page that I can not read because I don't have the character set. It all comes up ???????????… However, I can load that character set into Firefox (Firefox >Preferences > Advanced > Languages):

שפת טעינה של פיירפוקס

אם אני טוען את השפה הזו, אז אוכל לבקש את הדף בערכת התווים המקורית שלו ולהציג אותו במחשב שלי למרות שהברירת המחדל שלי היא en-US!

So… if I'm a Hindi student, studying English at Purdue and connected via VPN to the school's server, on vacation in Australia… there are 3 different settings that need to be applied to the application to be truly Internationalized – and אף לא אחד תלוי באחר.

My locale would come up as en-US, but my timezone is Australia, but the language I'm requesting from the website may be Hindi. If I were to program my application to make הנחות based on my computer's locale, I would be totally wrong – feeding the person English in an Eastern timezone. Ideally, I would program my application to offer שניהם language and timezone settings… but I wouldn't assume them based on locale.

איסלנד - הדוגמה האולטימטיבית

We're ignorant of multi-lingual and multi-locale challenges in the United States where we את כל לדבר אנגלית [סרקזם משתמע]. במדינות מסוימות, כגון איסלנד, למרות ששפת האם היא איסלנדית, העם האיסלנדי המדהים גדל בלמידת 3 שפות! מכיוון שאיסלנד היא מדינה במרכז אירופה וצפון אמריקה, חברותיהן פועלות ברחבי יבשות, שפות, ניבים של שפות ואזורי זמן מרובים משולחן העבודה שלהם!

אתרים איסלנדיים רבים בנויים באנגלית אמריקאית, אנגלית אנגלית, איסלנדית, ספרדית, ספרדית, צרפתית וגרמנית! רק דמיין כמה מאתגר יהיה לבנות Icelandair's יישומי אתרים ומערכות כרטוס ... וואו!

DISCLAIMER: I've had the absolute pleasure of working with the fine folks from Icelandair and can tell you they are some of the most talented and friendly professionals I've had the pleasure of working with. It's simply an amazing country and people! Go visit… take Icelandair and be sure to visit the הלגונה הכחולה!

שפה לעומת קידוד

There are even different character encodings within a single language that don't play well with each other! Example: A Japanese email written in Shift-JIS may render unreadable on a Japanese person's computer with localization set to ja-JP because their mail server only recognizes EUC-JP. Ideally, a customer should be able to set what encoding they would like as well as what language – simply ensuring that the encoding and language are compatible with what the client is requesting.

If I wish to read Japanese, I may have to select both Japanese as my language AND Shift-JIS for encoding to display that language properly. Here's some more confusion to add to the mix… some encoding types support several languages. UNICODE/UTF8 supports dozens. The reverse is true as well. Some languages can be read in many encoding types. If that doesn't make sense… I apologize, it's a very complex issue.

Someday I believe (hope) this will all change. I think the original designers of localization codes hoped that the language-country combo would be all that is needed… but we've become far more sophisticated. Remember, much of this was developed before an Internet existed. With the advent of GIS, אולי אדם יכול לבחור את הקידוד שלו ו- GIS יטפל במידע אזור הזמן והמקום.

בינאום

חזרה לתמיכה בינלאומית. אם ברצונך לספק יישום בינלאומי, עליך:

  1. תומך במספר סוגי קידוד, שפות, ויש לך קבצי תרגום להצגת תרגומים אלה.
  2. אפשר ללקוח להגדיר את שפתו, ואולי גם את סוג הקידוד, במידת הצורך.
  3. תומך באזורי זמן על ידי מתן אפשרות למשתמשים להפנות לאזור הזמן שלהם בהשוואה ל- GMT.
  4. השתמש בקודי לוקליזציה בזהירות ... הם אינם מתארים במדויק את מה שהמשתמש שלך מבקש בפועל וגם לא מה שהם יכולים לקרוא.

תרגום

תרגום מכונה עדיין בחיתוליו. ישנם מספר אתרים שם (וגם וורדפרס תוספים) that offer machine translation of your site. Don't be tempted to do this… there are two reasons why:

  1. אם תרגום מכונה עובד, למשתמש שבודק את האתר שלך כבר יהיה מתרגם לעבוד איתו.
  2. תרגום מכונה מבאס.

Don't believe me? Here's a Japanese translation for you:
מודבק מ קובץ מסאצו - אחי עם המון תמונות של חתולים:

ערך בלוג יפני

??????
- 00:29:35 מאת מסאצו

???????????????????????????
????????????????

?????????? (?)?

????????????????????????????????????????
??????????????????????????????

?????????????????????????????????? (?)

?????????????????

??????????????
??????
??????

????????????????????????????

???????????????????????????????

????????????????????????????????????????????????????????????????????????
?????????????????????????
?????????? אג ??????????????

????????????????????????????

מכונת תרגום:

?? האן ?????
-00: 29: 35 מאת מסאצו

The name of the fist saint of an/the elephant that appeared on yesterday's “a/the beast fist fleet ?? ranger” “?? Hann ????” with a/the radio actor Yutaka Mizushima….

? (?) זה עושה דיונון בקלות.

כי אפילו שחקן הרדיו של הקדוש אגרוף, אדון ????? של / החתול הם החבוש הסיני של נגאי איצ'ירו = כדור דרקון המטה של ​​a / the ?? ריינג'ר נראה כמו האנשים שההערה השנונה שלהם יודעת בקלות.

?????? (הזיעה) ששכחתי לחלוטין השנה "את סוד שמו של צי העל", של התרגול הרגיל בכל שנה?,

?????? אם אני כותב באיחור השנה,

??????? מקדש ??? (יכול איך?)? גידול היבשה (?? חתוך לא) פוקאמי ?? (? או להתבונן מסוגל?) האם זה מה שכן

?????? עם, זה הופך להיות "יכול /? /?", במילים אחרות, "קונג פו", כאשר בשורה ומחליפים את ראשו של השם.

למרות שזה נאמר להגדיל שניים נוספים לכאורה זה יכול להפוך לאיזה שם.

The truth is said to be “age” because the silver element symbol is Ag ?, although the name of “the ???? silver” the Takaoka ? technician of ??????? was thinking that the character called “?” was used with the association of a silver'screen?movie, if it calls it with an addition member.

?????? עם זאת, אני חושב באנוכיות, שהתיאוריה שלי אינה קשורה לכך ש"? " כלול בתו / הדמות הסינית.

I'm sure reversing the polarity on this translation would provide just as readable a diction in English. You did understand the entry, right?

תגובות 2

  1. 1

מה אתה חושב?

אתר זה משתמש Akismet כדי להפחית דואר זבל. למד כיצד הנתונים שלך מעובדים.