El passat 13 de març, Andrea Suárez, Fernando Gastón i Marcel Morillas, de la Unitat de Transferència del Coneixement del CRM (KTU), juntament amb Pau Varela i Mariona Fucho, de comunicació i divulgació, van participar a l’EspaiCiència dins del marc del Saló de l’Ensenyament.

Durant l’esdeveniment, van realitzar dos tallers. El primer, dirigit per l’Andrea Suárez, el Fernando Gaston i la Mariona Fucho, va consistir en una sessió pràctica sobre l’ús de la criptografia per a la compressió i transmissió eficient de dades.

Considerant la gran quantitat de dades generades cada minut i els costos associats amb la seva transmissió i emmagatzematge, la KTU, en col·laboració amb l’ALBA sincrotró, participa en el programa DYSEDAS per a la compressió de dades. Segons l’Andrea: “L’objectiu del projecte DYSEDAS és crear un programari per a la compressió d’imatges volumètriques, és a dir, una seqüència de moltes imatges molt semblants entre elles. Hi ha molts marges per a la compressió en aquest cas, atès que hi ha redundància de les dades, i s’estan explorant combinacions d’algorismes coneguts com ara el codi Huffman o el codi Golomb, juntament amb una reordenació o transformació reversibles de les imatges.”

 

Però, què és exactament la compressió?

La compressió té com a objectiu reduir la grandària dels fitxers per minimitzar-ne els costos.

En el taller, els participants van ser desafiats a codificar una frase de 12 caràcters com “me mira a mi” (incloent-hi els espais) i, utilitzant tres tipus de codis, van investigar si era possible encriptar-los i desencriptar-los. Van observar que un d’aquests codis era molt eficient en la compressió de dades, però no permetia la recuperació de la informació, descobrint així el mètode Huffman.

Què és el mètode Huffman?

El mètode Huffman és un algorisme de compressió de dades que crea codis prefix, assegurant que cap cadena de bits que representa un símbol sigui prefix d’una altra, òptims per a la compressió sense pèrdua d’informació. Va ser desenvolupat per David A. Huffman mentre estudiava a l’MIT i publicat el 1952.

Aquest mètode fa servir una taula de codis de longitud variable basada en la probabilitat o freqüència estimada d’aparició de cada símbol font. Els símbols més comuns són representats amb menys bits, reduint la redundància.

Com funciona el mètode Huffman?

  1. Analitzar l’entrada: Identifica els símbols únics i calcula les seves freqüències d’aparició.
  2. Crear nodes inicials: Crea un node per a cada símbol, assignant la seva freqüència com a pes inicial.
  3. Construir l’arbre Huffman:
    • Combina els dos nodes amb menor freqüència per crear un nou node, sumant les seves freqüències.
    • Inserir el nou node: Insereix el nou node a l’arbre mantenint l’ordre de freqüència.
  4. Repetir el procés fins que només quedi un node a l’arbre, que serà l’arrel de l’arbre Huffman.
  5. Assignar codis: Recorre l’arbre assignant 0 a les branques esquerra i 1 a les branques dreta, registrant el codi binari associat a cada símbol.
  6. Crear la taula de codis: Utilitza els codis per construir una taula de codis Huffman.

És important assenyalar que tot i ser eficient en la codificació de símbols per separat, el mètode Huffman no sempre és la millor opció comparat amb altres mètodes de compressió com l’arithmetic coding o els sistemes numèrics asimètrics.

Voleu posar-vos a proba?

Proveu a codificar ‘STATISTICS’ i cliqueu-hi a sobre per veure la resposta.  Tingueu en compte que la solució no és única.

Symbol Probability
S 0.3
T 0.3
I 0.2
A 0.1
C 0.1

 

 

El segon taller, a càrrec de l’Andrea Suárez, el Marcel Morillas i en Pau Varela, van explicar en què consisteix la incertesa, específicament, aplicada a models d’intel·ligència artificial.

Per que? Basicament, ens interessa dissenyar sistemes que puguin quantificar la seguretat de les respostes que donen, já que la IA pot ser entrenada amb dadees que no reflecteixin la realitat degut a biaixos de gènere, dades errònies o falta de representació de col·lectius minoritaris.

I… Com puc utilitzar la IA per la ciberseguretat?

El phishing és una estafa en la qual un ciberdelinqüent es fa pasar per algú altre per intentar extreure información sobre la persona afectada maliciosament.

En paraules d’Axel Masó, membre de la KTU, “al projecte LICSAI, la KTU ha elaborat una eina per quantificar la incertesa d’un model de Machine Learning (desenvolupat per I2Cat) que permet predir, donat el comportament virtual d’un individu, quin és el risc que aquest sigui víctima de phishing.”

En el taller, les estudiants havien de llegir uns textos i opinar sobre com de segurs estaven que allò podía ser phishing i, a continuación, entre les dades de tots els participants, van estudiar les gràfiques resultants per entendre el seu significat.

Subscribe for more CRM News

Stay updated to our mailing list to get the lastest information about CRM activities.

CRM Comm

Pau Varela & Mariona Fucho

CRMComm@crm.cat

 

CRM at the 9th European Congress of Mathematics

CRM at the 9th European Congress of Mathematics

The 9th European Congress of Mathematics (9ECM) took place in Seville from July 15 to 19, 2024, with 1300 participants, featuring plenary lectures, invited talks, minisymposium talks, and thematic session presentations. CRM participated with...

Hypatia 2024

Hypatia 2024

El passat dilluns 3 de juny va començar l’Hypatia 2024, un curs d’estiu que es va estendre fins dijous 6 de juny. L’Hypatia és una iniciativa per formar joves investigadors i investigadores i obrir nous camps d’estudi per aquells més sèniors,...

El CRM participa un any més a la Festa de la Ciència

El CRM participa un any més a la Festa de la Ciència

El CRM participa un any més a la Festa de la CiènciaEl Centre de Recerca Matemàtica (CRM) va participar en la 17a Festa de la Ciència amb dos tallers: La La Lambda: Les Matemàtiques de la Música, que va explorar la relació entre les matemàtiques i...