SOP-strings

De MediaWiki do Campus São José
Revisão de 16h01min de 4 de dezembro de 2009 por Msobral (discussão | contribs)
Ir para navegação Ir para pesquisar

Strings na linguagem C

Uma variável string representa uma cadeia de caracteres (ou sequência de caracteres). A própria palavra string pode ser traduzida para cadeia, no sentido de um encadeamento de coisas. Como não existe um tipo de dados string na linguagem C, strings são representadas por vetores de caracteres.

int main() {
  char palavra[16];

  printf("Digite uma palavra de até 15 letras: ");
  scanf("%s", palavra);

  printf("Você digitou %s\n", palavra);
}

No exemplo acima, foi declarada uma variável string chamada palavra, que pode conter até 15 caracteres. A quantidade de caracteres de que pode ser composta uma string é sempre uma unidade a menos que a capacidade do vetor, porque uma posição do vetor é reservada para assinalar o final da string. Olhando como uma cadeia de caracteres fica armazenada no vetor ajuda a entender isto, imaginando que foi digitado Teste:

<graphviz> digraph Frase { Frase [shape=Mrecord,label="<0>T|<1>e|<2>s|<3>t|<4>e|<5>\\0|<6> |<7> |<8> |<9> |<10> |<11> |<12> |<13> |<14> |<15> |<16> "] palavra [shape=record] palavra -> Frase:0 } </graphviz>

No diagrama acima, a caixa intitulada palavra corresponde à variável palavra, e esta contém a localização em memória onde está a sequência de caracteres que compõe a string (diz-se que palavra aponta a posição de memória onde inicia a string) . Note que depois do último e há um caractere \0. A barra invertida significa que o número mostrado naquela posição do diagrama corresponde ao código ASCII do caractere. O caractere de código 0 (zero) representa na verdade um caractere nulo (não visível e que não representa nenhum caractere real), e no caso serve para indicar onde está o final de string. Assim, pode-se perceber que as demais posições da variável palavra não são usadas, apesar de estarem ali disponíveis.

Uma outra forma de declarar strings, mostrada abaixo, não aloca memória previamente para conter a cadeia de caracteres.

int main() {
  char * senha;

  senha = "kaboom";

  printf("A senha é %s (não espalhe !)\n", senha);

}

O interessante nessa segunda forma de declarar string é o tipo da variável:

char * senha;

Essa declaração explicita que a variável senha serve para guardar endereços de memória. Esse tipo de variável se chama ponteiro, porque serve para apontar posições de memória que contém um determinado dado. No exemplo acima, a variável senha pode apontar uma posição de memória que contém um dado do tipo char. Mas inicialmente ela não aponta nenhuma posição em particular, uma vez que não foi inicializada. Mas quando a seguinte linha for executada:

senha = "kaboom";

... essa variável passará a apontar a posição de memória onde se encontra a string constante "kaboom". Assim, a relação entre a variável senha e a constante "kaboom" pode ser representada pelo diagrama:

<graphviz> digraph Frase { Frase [shape=Mrecord,label="<0>k|<1>a|<2>b|<3>o|<4>o|<5>m|<6>\\0"] senha [shape=record] senha -> Frase:0 } </graphviz>

Não há diferença de fato entre a primeira figura, que mostra a string que foi guardada na variável palavra, e a figura acima. Ambas mostram que variáveis string apontam posições de memória onde estão sequências de caracteres. A única diferença qualitativa entre esses exemplos é que no primeiro foi alocada (reservada) uma região de memória capaz de conter 16 caracteres, e seu endereço foi armazenado na variável palavra, e no segundo caso a variável não teve memória associada a si, mas foi usada para apontar uma área de memória onde estava a string constante "kaboom".


Iniciando e copiando strings