Acasă
Despre
Cautare
🌐
English Română
  • PHP si Unicode folosind UTF-8

    Read this post in English

    Aug 11, 2009 PHP php6 unicode utf-8
    Share on:

    Una dintre cele mai mari probleme legate de web este coadarea.

    Pe vremuri standardul folosit de baza folosit era ISO 8859-1, unde erau definite 191 caractere latine, iar 1 caracter = 1B. Pentru limbi diferite erau folosite codari diferite, dar de aici pleaca multe probleme legate de portabilitate, posibilitatea de a acoperii un numar mai mare de limbi etc.

    Problema apare cand un proiect trebuie sa fie disponibil in mai multe limbi, iar numarul limbilor nu este controlat. Un proiect cum este WordPress de exemplu trebuie sa poata fi folosit in orice limba.

    Unicode este o alternativa mult mai buna pentru ISO 8859-1, acesta avand definite peste 100.000 caractere. Cu alte cuvinte cuprinde cam toate caracterele existente in orice limba.

    Cum spuneam si la MySQL, caracterele UTF-8 au o lungime variabila intre 1 si 4B.

    Afisarea de continut UTF-8 in paginile PHP

    Pentru ca browserul sa interpreteze continutul unei pagini in format UTF-8, acesta trebuie sa primeasca header-ele potrivite:

    1<?php header("Content-type: text/html; charset=utf-8");?>
    

    Atentie! Headerul trebuie sa fie primele lucruri trimise catre server! Adica trebuie sa fie primul lucru afisat pe pagina.

    Tipul documentului se poate specifica si prin meta-ul “Content-Type”. Daca mai exista un tag meta similar in pagina acesta trebuie scos si inlocuit cu:

    1<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    

    **Fisierul .htaccess si procesarea stringurilor
    **

    Adaugati in fisierul .htaccess (pentru serverul Apache) urmatoarele linii:

    1# charset-ul default folosit de PHP
    2php_value default_charset utf-8
    3# codarea pentru mbstring
    4php_value mbstring.internal_encoding utf-8
    5php_value mbstring.func_overload 7
    

    Prima linie seteaza charset-ul default pentru PHP, acesta poate sa nu fie setat din php.ini.

    A doua si a treia linie linie seteaza functile mbstring (multi byte string).

    Folosind UTF-8, cum spuneam si mai sus 1 caracter != 1B, iar de aici pot aparea erori:

    1$var = 'aşadar';
    2
    3echo strlen($var).PHP_EOL; // 7
    4echo strtoupper($var).PHP_EOL; // AşADAR
    5
    6// folosind functii mbstring
    7echo mb_strlen($var).PHP_EOL; // 6
    8echo mb_strtoupper($var).PHP_EOL; // AŞADAR
    

    De asta am setat mai sus modul pentru mbstring folsind fisierul .htacess. Continutul introdus prin formulare trebuie procesat folosind functii mbstring, pentru a evita probleme ca cele de mai sus.

    Functiile disponibile sunt in manual.

    Codare continut vechi

    Exista multe moduri de a converti continut ISO 8859-1 in UTF-8. Doua dintre solutiile de conversie puse la dispozitie de PHP sunt:

    – functia iconv() care converteste dintr-un format in altul:

    1echo iconv("ISO-8859-1", "UTF-8", "Test");
    

    – functia utf8_encode() care converteste din ISO 8859-1 in UTF-8:

    1echo utf8_encode("Test");
    

    Ce ne rezerva viitorul?

    Mult asteptatul PHP6 va avea suport nativ pentru Unicode, deci toate trucurile de mai sus nu vor mai fi necesare. In momentul cand scriu acest blog PHP 6 este gata 70.70%, iar cu putin noroc va fi gata in mai putin de un an.

  • MySQL si Unicode folosind UTF-8

    Read this post in English

    Aug 10, 2009 information_schema MySQL unicode utf-8
    Share on:

    O data cu globalizarea, batranul cod ASCII nu mai este potrivit. Ganditi-va ca intr-o buna zi trebuie sa dezvoltati un proiect in germana, rusa sau chiar japoneza, puteti adapta characterset-ul pentru fiecare din aceste limbi sau puteti pur si simplu sa-l dezvoltati folosind Unicode.

    Pentru a folosi Unicode cu MySQL se poate folosi UTF-8.

    Trebuie sa retineti ca caracterele UTF-8 au o marime variabila si sunt compatibile ASCII. In ASCII 1 caracter = 1B, in UTF-8 1 caracter poate avea intre 1 si 4 B.

    Charset si collation UTF-8 pe server

    In MySQL tipul caracterelor este dictat de charset.

    Pentru a vedea daca este instalat pe server:

    1SHOW CHARSET LIKE 'utf8';
    

    sau cu information_schema

    1SELECT * FROM `CHARACTER_SETS` WHERE CHARACTER_SET_NAME = 'utf8';
    

    Daca a fost gasit charset-ul atunci putem continua.

    Un alt element care apare la charset este collation, acesta se foloseste in comparatii intre string-uri la ordonare.

    Pentru a vedea ce “collation” sunt disponibile pe server:

    1SHOW COLLATION WHERE CHARSET = 'utf8';
    

    sau cu information_schema

    1SELECT * FROM `COLLATIONS` WHERE CHARACTER_SET_NAME = 'utf8';
    

    Collation este in functie de limba in principiu, pentru a putea compara stringuri cu sau fara diacritice de exemplu, sau se mai poate folosi cel “bin” care va face ordonarea in mod binar, adica “A” este mai mare decat “a” de exemplu.

    Daca nu se va specifica collation, atunci se va folosi cel marcat ca default.

    UTF-8 si baza de date

    La crearea unei baze de date se poate specifica charset-ul default care se va folosi la toate tabelele noi la care nu este specificat charset-ul.

    De exemplu:

    1CREATE DATABASE db_name CHARACTER SET utf8 COLLATE utf8_romanian_ci;
    

    Sau pentru a modifica characterset-ul default la o baza de data deja existenta:

    1ALTER DATABASE db_name CHARACTER SET utf8 COLLATE utf8_romanian_ci;
    

    UTF-8, tabelele si coloanele

    Pentru a modifica tabelele deja existente se foloseste ALTER TABLE.

    Un tabel poate avea un charset si un collation default iar fiecare coloana poate avea propriul charset si collation.

    Pentru a vedea mai multe detalii despre un tabel se pot folosi:

    1SHOW CREATE TABLE tab;
    

    Pentru a seta un charset pe un table existent:

    1ALTER TABLE tab CHARSET = utf8 COLLATE = utf8_romanian_ci;
    

    Pentru a modifica charset-ul pe o coloana de timpul VARCHAR(200) se foloseste:

    1ALTER TABLE tab MODIFY c1 VARCHAR(200) CHARSET utf8 COLLATE utf8_romanian_ci;
    

    Marimea stringurilor

    O “problema” care poate aparea este legata de marimea unui caracter, acesta poate avea marimea intre 1 si 4B. De asta pentru masurarea unui camp care are un string (cum ar fi un varchar) trebuie folosita CHAR_LENGTH(str) si nu LENGTH().

    Un mic exemplu:

    1SET @var = 'aşadar';
    2SELECT CHAR_LENGTH(@var) AS 'Char', LENGTH(@var) AS 'Length';
    3
    4// Rezulta: Char = 6 si Length = 7 pentru ca ş ocupa 2B
    
  • PHP 5.3 ce aduce nou?

    May 10, 2009 closures lambda php5 php5.3 php6 unicode
    Share on:

    Pana la versiunea mult asteptata 6, PHP 5.3 este deja la RC 2.

    PHP 5.3 vine cu multe lucruri noi, de fapt sunt atat de multe incat putea sa fie cu succes versiunea 6, dar de ce nu este PHP 6? Pentru ca toata lumea se asteapta ca versiunea 6 sa aiba suport Unicode, iar cand o comunitate de programatori asteapta de mai bine de 3 ani asta, nu poti pur si simplu sa le spui ca te-ai gandit sa lasi suportul pentru Unicode pentru versiunea 7.

    Namespaces

    Printre noutati se afla si namespaces, mi se pare o idee interesanta dar nu fantastica, initial acestea nu erau pe lista de prioritati pentru ca se considera ca problema lor se poate rezolva relativ simplu folosind prefixuri si clase.

    Un exemplu de namespace:

     1<?php
     2// clasa.php
     3
     4// definirea namespace-ului, in cazul asta trebuie sa fie prima instructiune din fisier
     5namespace teste;
     6
     7// o clasa cu un conscturctor
     8class clasaTest {
     9   function __construct() {
    10      echo "in constrcutor";
    11   }
    12}
    13
    14// o functie
    15function funcTest() {
    16   echo "in functie";
    17}
    18
    19// o constanta
    20const CONSTANTA = 'global';
    21?>
    

    Acelasi fisier se mai poate defini intr-un anumit namespace si in felul urmator:

     1<?php
     2// clasa.php
     3
     4// definirea namespace-ului
     5namespace teste {
     6
     7   // o clasa cu un conscturctor
     8   class clasaTest {
     9     function __construct() {
    10        echo "in constrcutor";
    11     }
    12   }
    13
    14   // o functie
    15   function funcTest() {
    16      echo "in functie";
    17   }
    18
    19   // o constanta
    20   const CONSTANTA = 'global';
    21
    22}
    23?>
    

    Fisierul in care fac testele:

     1<?php
     2
     3// includem fisierul de mai sus
     4require('clasa.php');
     5
     6$obj = new clasaTest(); // Fatal Error:clasa 'clasaTest' not found in ...
     7
     8$obj2 = new teste\clasaTest(); // afisaza "in constructor"
     9
    10// aparent suprascriem constanta
    11const CONSTANTA = 'local';
    12
    13echo CONSTANTA; // afisaza "local"
    14
    15echo teste\CONSTANTA; // afisza "global"
    16
    17teste\funcTest(); // afisaza "in functie"
    18
    19?>
    

    iar daca vrem sa nu mai folosim operatorul “&#8221; si numele namespace-ului:

     1<?php
     2// trebuie sa fie prima insctructiune
     3namespace teste;
     4
     5// includem fisierul de mai sus
     6require('clasa.php');
     7
     8$obj = new clasaTest(); // afisaza "in constructor";
     9
    10// suprascriem constanta
    11const CONSTANTA = 'local'; // Notice: Constant teste\CONSTANTA already defined in...
    12
    13echo CONSTANTA; // afisaza global
    14
    15?>
    

    Si acestea sunt functiile de baza, folosindu-le pe acestea o sa ajute portabilitatea, si scalabilitatea. Acum numele de clase si functii nu mai trebuie sa fie unice, trebuie pur si simplu sa fie in namespace-uri diferite.

    Functile lambda si “closures”

    Cele mai interesante facilitati mi se par functile lambda si “closures”.

    Suna cunoscut? Poate pentru ca sunt foarte folosite in JavaScript:

    1<script language="javascript">
    2closure = function(text) {
    3   alert(text);
    4}
    5
    6closure("hello");
    7</script>
    

    Iar acum in php este posibil:

    1<?php
    2$closure = function ($text) {
    3   return $text;
    4};
    5
    6echo $closure("hello");
    7?>
    

    Tot la functii lambda si “closures” a mai fost introdus si “use”, care permite folosirea unor variabile din exterior:

    1<?php
    2$x = 'Claudiu';
    3$closure = function ($text) use ($x) {
    4   return $text.' '.$x;
    5};
    6
    7echo $closure("hello"); // afisaza "hello Claudiu"
    8?>
    

    Iar daca in exemplul de mai sus vrem sa modificam variabilele care sunt parametri la “use” nu trebuie decat sa le trimitem prin referinta:

     1<?php
     2$x = 'Claudiu';
     3$closure = function ($text) use (&$x) {
     4   $x = 'utilizator';
     5   return $text;
     6};
     7
     8echo $closure("hello"); // afisaza "hello"
     9
    10echo $x; // afisaza "utilizator"
    11?>
    

    Iar ca sa luam un exemplu concret unde pot fi utile, sa zicem functia “usort“:

     1<?php
     2function cmp($a, $b)
     3{
     4    if ($a == $b) return 0;
     5    return ($a < $b) ? -1 : 1;
     6}
     7
     8$a = array(3, 2, 5, 6, 1);
     9
    10usort($a, "cmp");
    11
    12// este echivalent cu:
    13
    14$a = array(3, 2, 5, 6, 1);
    15
    16usort($a, function ($a, $b){
    17    if ($a == $b) return 0;
    18    return ($a < $b) ? -1 : 1;
    19});
    20?>
    

    Dragut, nu? Cred ca asa se vede si mult mai clar ce se intampla in functie si la ce foloseste aceasta.

    De asemenea obiectele se pot comporta ca niste closures folosind noua “metoda magica” __invoke():

     1<?php 
     2
     3class testCl {
     4   function __invoke() {
     5      return "metoda de closure";
     6   }
     7}
     8
     9$obj = new testCl(); // instantiem clasa
    10echo $obj(); // o apelam ca pe un closure si afisaza "metoda de closure"
    11
    12?>
    

    NOWDOC

    NOWDOC este similar cu HEREDOC doar ca nu interpreteaza variabilele si caracterele speciale. Cu alte cuvinte HEREDOC era echivalentul ghilimelelor duble, NOWDOC este echivalentul ghilimelelor simple:

     1<?php
     2
     3$var = "5";
     4
     5// ghilimele duble
     6echo "Valoarea este: $var <br>"; // "Valoarea este 5"
     7
     8// ghilimele simple
     9echo 'Valoarea este: $var <br>'; // "Valoarea este $var"
    10
    11// HEREDOC
    12echo <<<HEREDOC
    13Valoarea este: $var <br>
    14HEREDOC;
    15// "Valoarea este 5"
    16
    17// NOWDOC
    18echo <<<'NOWDOC'
    19Valoarea este: $var <br>
    20NOWDOC;
    21// "Valoarea este $var"
    22
    23?>
    

    Operatorul “?”

    Acest operator a fost putin “inbunatatit”:

    1<?php
    2// inainte
    3echo $_GET['ceva']?$_GET['ceva']:false;
    4
    5// acum
    6echo $_GET['ceva']?:false;
    7
    8?>
    

    Cu alte cuvinte acum conditia poate fi folosita ca valoare pentru adevarat.

    goto

    Sincer… nuprea vad de ce era nevoie de asa ceva, dar poate nu e chiar asa rau. Si un mic exemplu:

     1<?php
     2
     3$x = 1;
     4
     5label1:
     6echo "la label1 $x <br>";
     7$x++;
     8
     9if($x>3) goto label2;
    10goto label1;
    11
    12label2:
    13echo "la label2";
    14
    15// va afisa:
    16// la label1 1
    17// la label1 2
    18// la label1 3
    19// la label2
    20?>
    

    Arata mai mult a Basic decat a PHP dar chiar functioneaza.

    Mai sunt si alte noutati, am incercat sa le enumar doar pe cele care mi se pare mie mai interesante.

    Din pacate toate aceste lucruri nu vor ajunge sa fie folosite cu adevarat pe scara larga decat poate peste 2-3 ani, sau chiar mai mult. Poate nu este PHP 6 dar eu cred ca toate schimbarile vor fi mai degraba asociate cu PHP 6 decat cu PHP 5, nu cred ca vrea nimeni sa riste o intreaga aplicatie care foloseste namespace-uri sau closures pentru ca nu este versiunea “noua” de PHP 5.

Claudiu Perșoiu

Programare, tehnologie și altele
Mai multe

Postări recente

  • 30 de ani de PHP
  • Slider in Tasmota folosind BerryScript
  • Proiectul care rezista probei timpului
  • Docker in interiorul wsl2
  • Migrând de la Wordpress
  • Calea personalizată pentru Composer cache
  • Magento2 si crudul adevar
  • Un pic de PHP, Go, FFI si atmosfera de sarbatori

DIVERSE 72 PHP 68 JAVASCRIPT 22 BROWSERS 12 MYSQL 12 WEB STUFF 12 MAGENTO 7 DESIGN PATTERNS 5 HARDWARE 3 HOME AUTOMATION 2 LINUX-UNIX 2 GO 1 MISCELLANEOUS 1

PHP 53 JAVASCRIPT 20 PHP5.3 14 MYSQL 13 PHP6 12 PHP5 10 FIREFOX 9 CERTIFICARE 8 INTERNET EXPLORER 8 ZCE 8 ZEND 8 CERTIFICATION 7 MAGENTO 7 HACK 6
Toate etichetele
10 ANI1 3D1 ADOBE AIR2 AJAX1 ANDROID3 ANGULAR1 ANONYMOUS FUNCTIONS3 API1 APP1 BERRYSCRIPT1 BETA1 BOOK1 BROWSER4 C2 CALCULATOARE1 CARTE2 CERTIFICARE8 CERTIFICATION7 CERTIFIED2 CERTIFIED DEVELOPER1 CHALLENGE1 CHM1 CHROME1 CLASS1 CLI2 CLOSURES5 COD1 CODE QUALITY1 CODEIGNITER3 COFFEESCRIPT1 COLLECTIONS1 COMPOSER1 CSS3 CSV1 CURL1 DEBUG1 DESIGN PATTERNS4 DEVELOPER1 DEVELOPMENT TIME1 DIAGRAME1 DOCKER2 DOCKER-COMPOSE1 DOUGLAS CROCKFORD3 DRIVERE2 ELEPHPANT2 ENGINEER1 EXAMEN1 EXCEL1 FACEBOOK2 FEEDBACK1 FFI1 FINALLY1 FIREFOX9 FISIERE1 FPDF1 FRUMOS1 FTP1 GAMES1 GD2 GENERATOR1 GO1 GOOGLE5 GOOGLE ANALYTICS1 GOOGLE CHROME3 GOOGLE MAPS2 HACK6 HARDWARE1 HC-911 HEADER1 HEIGHT1 HOMEASSISTANT2 HTML2 HTML HELP WORKSHOP1 HTML51 HUG1 HUGO1 IDE1 IMAGINE1 INFORMATION_SCHEMA1 INI1 INTERNET4 INTERNET EXPLORER8 IPV41 IPV61 ISP1 ITERATOR2 JAVA1 JAVASCRIPT20 JQUERY1 LAMBDA2 LAPTOP2 LINUX1 LIVELY1 LUNI1 MAGENTO7 MAGENTO22 MAP1 MAPS1 MICROSOFT1 MINESWEEPER1 MOTIVATION1 MSN MAPS1 MYSQL13 MYSQL WORKBENCH1 NGINX1 NODE.JS2 NOFALLOW1 NOSQL1 OBSERVER3 OBSERVER PATTERN1 OOP1 OPERA1 OPTIMIZATION1 ORACLE2 PAGESPEED1 PAIR1 PARSE_INI_FILE1 PASCAL1 PEAR1 PECL1 PERSON VUE2 PHAR1 PHONEGAP2 PHP53 PHP ELEPHANT2 PHP FOR ANDROID1 PHP-GTK1 PHP42 PHP510 PHP5.314 PHP5.46 PHP5.53 PHP5.61 PHP612 PHP7.41 POO1 PR1 PROGRAMMING1 PROIECTE1 RETEA1 REVIEW1 ROCK STAR1 ROMANIAN STEMMER2 RSS1 SAFARY1 SCALAR TYPE HINTING1 SCHEME1 SEO1 SET1 SHOPPING CART PRICE RULE1 SIMPLEXML1 SINGLETON1 SOAP2 SPL2 SQLITE1 SSH1 STACK TRACE1 STDERR1 STDIN1 STDOUT1 STOCATE1 STUDY GUIDE1 SUN2 SYMFONY2 TABLE1 TASMOTA1 TEST TO SPEECH1 TITANIUM2 TRAITS1 TTS1 UBUNTU1 UNICODE3 UTF-82 VECTOR1 VISTA2 WEB2 WEBKIT1 WINBINDER1 WINDOWS2 WORDPRESS1 WSL21 WYSIWYG1 XP3 YAHOO3 YAHOO MAPS2 YAHOO OPEN HACK1 YSLOW1 YUI1 ZCE8 ZCE5.31 ZEND8 ZEND FRAMEWORK4
[A~Z][0~9]

Copyright © 2008 - 2025 CLAUDIU PERȘOIU'S BLOG. Toate drepturile rezervate