Saturday, June 28, 2014

Atualizou o Fedora e o touchpad ficou lento? [FIXED]

tl;dr: Não se assuste! Já já vai sair um update pro pacote xorg-x11-server-common que corrige isso. Aqui está o bugzilla deste problema.

Ontem de noite cometi aquele erro clássico: atualizei uns 200 pacotes no meu Fedora 20, desliguei o laptop e fui dormir. Quando fui dar uma geral nas internerds hoje de tarde, percebi que o touchpad estava incrivelmente lento, tendo que passar o dedo umas 15 vezes pro cursor ir de um canto a outro da tela. Na hora pensei "Putz! Nem vi o que atualizei ontem!".

Mas tudo bem, nada que uma googlada não resolva. Procurei por "fedora 20 update mouse slower" e achei posts e bugs descrevendo o problema. O pacote xorg-x11-server-common-1.14.4-10.fc20.x86_64 inclui uma mudança que deveria ser uma melhoria em algumas situações usando dois ou mais monitores,  porém para muita gente acabou "estragando" o uso do touchpad e o QA não pegou essa regressão. Mas logo logo sai o release -11.fc20.x86_64 corrigindo isso (já está no updates-testing).

Por enquanto eu rodei o workaround que foi comentado no post e no bug: rodei "synclient MinSpeed=6" em um terminal e o touchpad ficou "aceitável" por enquanto.

Update 2014-06-29: Já está disponível a atualização que resolve o problema:

$ rpm -q --changelog xorg-x11-server-common | head -3
* Sex Jun 27 2014 Peter Hutterer 1.14.4-11
- Revert the previous fix, it breaks a couple of touchpads (#1104789)

Thursday, June 19, 2014

Programando um Arduino em estilo old-school

Talvez o nome mais apropriado fosse "Programando um Arduino da maneira errada" ou "... da maneira mais difícil", mas o fato é que desde que comecei a brincar com Arduinos eu queria "meter a mão na massa" e programar ele à moda antiga, sem IDEs e tal, usando assembly e pior, codificando os opcodes binários manualmente. Sei lá, acho que é cacoete de quem começou com os processadores de 8bits e acostumou a "assemblar" seus próprios programas. Eu sei bem que o objetivo do Projeto Arduino não é esse, que o código não será compatível com outras placas, que será incrivelmente mais difícil, etc etc etc. Não interessa, um fuçador tem que fuçar. :-)

Para começar, a gente precisa olhar a plaquinha Arduino (neste caso, a Uno) pelo que ela realmente é: uma forma simplificada e prática de usar o microcontrolador ATmega328P. Então o próximo passo é ir lá no site da Atmel e baixar o datasheet do microcontrolador (aqui em versão completa, são 36MB), e depois disso baixar também a referência do conjunto de instruções da família AVR (à qual o Atmega328P pertence). Com estes dois documentos, já conseguimos entender bem como é que o bichinho funciona, e como são as suas instruções. Imprima e leia algumas vezes.

O próximo passo é instalar as ferramentas que serão usadas para gravar o programa na plaquinha e para manipular os arquivos de código. O bom é que elas são as mesmas ferramentas usadas pela interface IDE do Arduino: o avrdude para gravar na flash do ATmega328 e as GNU binutils (cross-compilando para AVR). Se você tem o ambiente do Arduino instalado (no Fedora, sudo yum install arduino) está tudo pronto. Uma maneira legal de começar a sujar as mãos com bits crus devagarinho é compilar um programa de exemplo qualquer na interface do Arduino, e depois ir no /tmp olhar os arquivos intermediários no diretório de build. Arrisque-se a digitar "avr-objdump -d foobar.elf" e olhar o código gerado pelo compilador. :-)

Para o meu primeiro teste eu quis fazer um pouco mais do que o tradicional Hello World do Arduino, que é piscar um led. Então resolvi fazer um programa que pisque 8 leds em zigue-zague, usando 8 pinos digitais. Decidi usar os primeiros 8 pinos, D0 a D7, porque eles são todos bits da mesma porta D para o ATmega328, o que facilita a programação. O programa basicamente seta um bit em um registrador e o envia para a porta, esperando um delay rápido e depois deslocando o registrador um bit para a direita e escrevendo na porta, em laço até zerar o registrador. Depois disso, recarrega um valor com um bit setado no registrador e faz o mesmo deslocando para a esquerda, até zerar (quando o bit "cair fora" do registrador:-).

Li algumas páginas relacionadas a sintaxe padrão de assembly AVR, e depois resolvi fazer tudo manualmente, em um formato livre. Então abri o vim e criei este arquivo, que chamei de teste.asm.
; Teste de programação do Arduino "assemblando" manualmente os opcodes
; DDRD = 0a
; PORTD = 0b
; Os opcodes precisam ser convertidos para little-endian no .bin
addr    opcode    instruction
0000    ef0f    ldi r16, 0xff    ; programa porta D como saídas
0001    b90a    out DDRD, r16
0002    e000    ldi r16, 0x00    ; limpa registradores de contagem dos delays
0003    e010    ldi r17, 0x00
0004    e440    ldi r20, 0x40    ; inicio
0005    b94b    out PORTD, r20   ; loop1, led para a direita
0006    e024    ldi r18, 0x04
0007    9503    inc r16          ; delay1
0008    f7f1    brne delay1
0009    9513    inc r17
000a    f7e1    brne delay1
000b    952a    dec r18
000c    f7d1    brne delay1
000d    9546    lsr r20
000e    f7b1    brne loop1
000f    e042    ldi r20, 0x02
0010    b94b    out PORTD, r20   ; loop2, led para a esquerda
0011    e024    ldi r18, 0x04
0012    9503    inc r16          ; delay2
0013    f7f1    brne delay2
0014    9513    inc r17
0015    f7e1    brne delay2
0016    952a    dec r18
0017    f7d1    brne delay2
0018    0f44    lsl r20
0019    f7b1    brne loop2
001a    cfe5    rjmp inicio
Claro que eu não saí digitando tudo direto. Eu comecei cada linha com dois tabs, e comecei a listar as instruções aos poucos, pensando em como ia usar os registradores. Acabei decidindo usar os registradores "altos" (r16 em diante) para poder usar a instrução LDI (Load Immediate), que só manipula de r16 a r31. Quando eu tiver mais experiência com o conjunto de instruções acho que vou começar a usar mais os registradores baixos também. Depois de prontas as instruções, preenchi a primeira coluna com os endereços, e então fui aos poucos olhando cada uma das instruções na referência do AVR Instruction Set.

Aqui cabem duas observações interessantes:
  1. O AVR é um processador RISC de 8 bits, e os opcodes têm um tamanho fixo de 16 bits (algumas instruções precisam 32, mas isso fica como tema para casa). Embora na referência eles sejam demonstrados como números binários de 16 bits, na hora de gravar na flash eles precisam ser convertidos para little-endian. Minha primeira tentativa de criar o arquivo "binário" com o código acabou dando errado, e tive que digitar tudo de novo invertendo os bytes de cada opcode. :-)
  2. Embora cada instrução ocupe 2 bytes, o Program Counter do AVR aponta para instruções, e não para bytes. Isso significa que os offsets de branches e jumps são offsets em instruções, e não em bytes. Então para pular 4 instruções pra cima, se usa um offset de -4, mesmo que na verdade se esteja pulando 8 bytes para trás. Pra completar a confusão, o objdump mostra o disassembly com endereços de bytes, e ele mostra os opcodes invertidos, já em formato little-endian.

Feita a tradução dos mnemônicos para os opcodes binários (e calcular os offsets de branches contando em hexa em complemento de 2 nos dedos), agora a tarefa é digitar todos os opcodes em um arquivo, que será o "binário compilado" desse nosso esforço manual. Eu uso o hexedit, que é simples e direto, mas qualquer editor hexadecimal serve. Lembre-se de digitar os opcodes convertendo para little-endian. Fazendo um hexdump do "código compilado" teste.bin fica assim:

$ hexdump -C teste.bin
00000000  0f ef 0a b9 00 e0 10 e0  40 e4 4b b9 24 e0 03 95  |........@.K.$...|
00000010  f1 f7 13 95 e1 f7 2a 95  d1 f7 46 95 b1 f7 42 e0  |......*...F...B.|
00000020  4b b9 24 e0 03 95 f1 f7  13 95 e1 f7 2a 95 d1 f7  |K.$.........*...|
00000030  44 0f b1 f7 e5 cf 00 00  00 00 00 00 00 00 00 00  |D...............|
No total são 54 bytes, para 27 instruções de máquina. Eu completei com uns zeros no final, só para fechar 64 bytes e ficar tudo alinhado. :) O opcode do NOP em AVR é 0x0000 então tá tranquilo. :-)

Um passo interessante, agora, é transformar esse arquivo contendo opcodes de AVR em um arquivo que o avr-objdump entenda e possa desassemblar, para que a gente confira o código e principalmente os offsets de branches, que o objdump nos ajuda a entender. Não é um passo necessário, mas é bom pra ter certeza que o código que montamos está realmente fazendo o que pretendemos que ele faça. Eu não consegui achar uma maneira de convencer o objdump a desmontar o binário "cru" diretamente, então usei o objcopy para transformá-lo em um ELF comum:

$ avr-objcopy -I binary -O elf32-avr --rename-section .data=.text,contents,code teste.bin \
    teste.elf
$ avr-objdump -d teste.elf

teste.elf:     file format elf32-avr

Disassembly of section .text:

00000000 _binary_teste_bin_start:
   0:    0f ef           ldi    r16, 0xFF    ; 255
   2:    0a b9           out    0x0a, r16    ; 10
   4:    00 e0           ldi    r16, 0x00    ; 0
   6:    10 e0           ldi    r17, 0x00    ; 0
   8:    40 e4           ldi    r20, 0x40    ; 64
   a:    4b b9           out    0x0b, r20    ; 11
   c:    24 e0           ldi    r18, 0x04    ; 4
   e:    03 95           inc    r16
  10:    f1 f7           brne    .-4          ; 0xe _binary_teste_bin_start+0xe

  12:    13 95           inc    r17
  14:    e1 f7           brne    .-8          ; 0xe _binary_teste_bin_start+0xe
  16:    2a 95           dec    r18
  18:    d1 f7           brne    .-12         ; 0xe _binary_teste_bin_start+0xe
  1a:    46 95           lsr    r20
  1c:    b1 f7           brne    .-20         ; 0xa _binary_teste_bin_start+0xa
  1e:    42 e0           ldi    r20, 0x02    ; 2
  20:    4b b9           out    0x0b, r20    ; 11
  22:    24 e0           ldi    r18, 0x04    ; 4
  24:    03 95           inc    r16
  26:    f1 f7           brne    .-4          ; 0x24 _binary_teste_bin_start+0x24
  28:    13 95           inc    r17
  2a:    e1 f7           brne    .-8          ; 0x24 _binary_teste_bin_start+0x24

  2c:    2a 95           dec    r18
  2e:    d1 f7           brne    .-12         ; 0x24 _binary_teste_bin_start+0x24
  30:    44 0f           add    r20, r20
  32:    b1 f7           brne    .-20         ; 0x20 _binary_teste_bin_start+0x20
  34:    e5 cf           rjmp    .-54         ; 0x0 _binary_teste_bin_start
    ...


Legal, com isso já consigo verificar que eu calculei os opcodes corretamente, e que meus offsets de branches e jumps estavam certos. Agora só falta gravar no Arduino. Para isso, temos que converter o binário em um arquivo no formato Intel Hex, com extensão .hex. Este é o formato usado pelo avrdude, que é quem conversa com o bootloader do Arduino e grava o nosso programa lá. Os comandos abaixo deram conta do recado:

$ avr-objcopy -I binary -O ihex teste.bin teste.hex
$ avrdude -P /dev/ttyUSB0 -p ATmega328P -b 115200 -c arduino -U flash:w:teste.hex:i


O avrdude gera bastante saída na tela, dá pra ir acompanhando os passos da gravação. Note que eu usei um Garagino com uma porta serial FTDI que o acompanha, e ela é detectada como /dev/ttyUSB0. Uma plaquinha Arduino Uno, por exemplo, é detectada como /dev/ttyACM0, então o comando acima deverá ser adaptado. Feita a programação e montado o circuito, voilà! Está tudo funcionando como esperado, em apenas 27 instruções de código!

Estou muito feliz de finalmente ter escovado estes bits, que estavam me esperando desde que comprei a primeira Arduino Uno. Só não tinha dado tempo ainda de pensar num projetinho simples porém não tão trivial, sentar e começar a codar. Levei horas codificando os opcodes manualmente, e é claro que não pretendo mais fazer isso. Meus próximos testes serão utilizando o GNU Assembler para facilitar as coisas. Estou commitando estes e outros testes com Arduino neste repositório no github, para facilitar a publicação e utilização pelos interessados.

Ah, antes que me esqueça: desde que a gente não sobrescreva o bootloader do Arduino, que ocupa os últimos 512 bytes da flash, vai continuar funcionando tudo normalmente, e a placa continua compatível com a IDE do Arduino. Continua sendo possível criar e gravar um programa pelas vias normais, usando a IDE e clicando botõezinhos. :-) Se o nosso programa tiver menos do que 32256 bytes não vai sobrescrever o bootloader e tá tudo certo.

Update 2014-06-20: Na verdade nem precisa converter o arquivo binário para ihex. O avrdude também pode ler arquivos binários sem formato, especificando a opção "raw". Agora mesmo eu mudei um pouco o padrão dos leds e escrevi o teste.bin direto usando "-U flash:w:teste.bin:r". O ":r" no final é que indica o tipo, sendo 'i' Intel Hex, e 'r' raw. Só o que se perde com isso é a possibilidade de especificar o endereço de carga. O ihex pode especificar endereços, para o caso de querermos gravar um conteúdo na flash a partir de um ponto específico. O raw sempre vai ser gravado a partir de 0 na flash. Bom saber que nem precisa fazer a dança do objcopy, embora seja mais reconfortante fazer um objdump e confirmar o código antes de gravar. :-)