For Emacs: -*- coding: utf-8 -*- IN1020 Løsningsforslag for øvelsesoppgaver 1.-6.9.2017 Oppgave 1 sjekkes i oppgave 2. Oppgave 3 Kommandoen «file tekst-*» gir følgende svar: tekst-1.txt: UTF-8 Unicode text tekst-2.txt: ISO-8859 text tekst-3.txt: ASCII text Oppgave 4 Dette er forskjellene: tekst-1.txt: ... c2 ab ... c3 a6 ... c2 bb ... tekst-2.txt: ... ab ...... e6 ...... bb ...... tekst-3.txt: ... 22 ...... 61 ...... 22 ...... Her ser vi de tre tegnene « æ » kodes som to byte i tekst-1.txt (som er i UTF-8) men som én byte i tekst-2.txt (som er i ISO-8859). I tekst-3.txt (som er i ASCII) er de erstattet med " a " fordi de tre tegnene «æ» ikke finnes i ASCII. Oppgave 5 Kommandoene iconv -f ISO8859-1 -t UTF-8 tekst-2.txt >tekst-2-utf8.txt iconv -f ASCII -t UTF-8 tekst-3.txt >tekst-3-utf8.txt vil konvertere som ønsket. Da vil kommandoen file tekst-*-utf8.txt fortelle oss at filene vi laget er tekst-2-utf8.txt: UTF-8 Unicode text tekst-3-utf8.txt: ASCII text Så er neste spørsmål: Hvorfor er tekst-3-utf8.txt stadig ASCII? Det er, som nevnt i forelesningen, en egenskap ved UTF-8 at ASCII er «innebygget» i UTF-8 og forblir uendret.