Mudanças entre as edições de "PRG29003: Introdução a Listas"

De MediaWiki do Campus São José
Ir para navegação Ir para pesquisar
 
(93 revisões intermediárias por 2 usuários não estão sendo mostradas)
Linha 1: Linha 1:
 +
[[PRG29003:_Introdução_a_Tabelas_Hash|[Próxima aula]]]
 +
 +
__toc__
 +
 +
 
* [https://video.search.yahoo.com/video/play;_ylt=A0LEV7lAXs1XG2sA1rwPxQt.;_ylu=X3oDMTBsa3ZzMnBvBHNlYwNzYwRjb2xvA2JmMQR2dGlkAw--?p=linked+list+video+khan+academy&tnr=21&vid=a261fe6fc79a3f7e4fd85faea0b52f1c&l=574&turl=http%3A%2F%2Fts2.mm.bing.net%2Fth%3Fid%3DOVP.Vb3ec24372ca57a7f1037e17de2583d2b%26pid%3D15.1&sigi=12b13n06v&rurl=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DJu5q1hhFCso&sigr=11bh4tdn6&tt=b&tit=Linked+Lists%3A+Introduction&sigt=10qig1lga&back=https%3A%2F%2Fsearch.yahoo.com%2Fyhs%2Fsearch%3Fp%3Dlinked%2Blist%2Bvideo%2Bkhan%2Bacademy%26type%3D__alt__ddc_linuxmint_com%26hspart%3Dddc%26hsimp%3Dyhs-linuxmint%26fr%3Dyhs-ddc-linuxmint%26ei%3DUTF-8&sigb=14vc076df&hspart=ddc&hsimp=yhs-linuxmint Um video introdutório da Khan Academy]
 
* [https://video.search.yahoo.com/video/play;_ylt=A0LEV7lAXs1XG2sA1rwPxQt.;_ylu=X3oDMTBsa3ZzMnBvBHNlYwNzYwRjb2xvA2JmMQR2dGlkAw--?p=linked+list+video+khan+academy&tnr=21&vid=a261fe6fc79a3f7e4fd85faea0b52f1c&l=574&turl=http%3A%2F%2Fts2.mm.bing.net%2Fth%3Fid%3DOVP.Vb3ec24372ca57a7f1037e17de2583d2b%26pid%3D15.1&sigi=12b13n06v&rurl=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DJu5q1hhFCso&sigr=11bh4tdn6&tt=b&tit=Linked+Lists%3A+Introduction&sigt=10qig1lga&back=https%3A%2F%2Fsearch.yahoo.com%2Fyhs%2Fsearch%3Fp%3Dlinked%2Blist%2Bvideo%2Bkhan%2Bacademy%26type%3D__alt__ddc_linuxmint_com%26hspart%3Dddc%26hsimp%3Dyhs-linuxmint%26fr%3Dyhs-ddc-linuxmint%26ei%3DUTF-8&sigb=14vc076df&hspart=ddc&hsimp=yhs-linuxmint Um video introdutório da Khan Academy]
 +
* [https://www.geeksforgeeks.org/data-structures/ Estruturas de dados]
 +
* [https://github.com/jamiebuilds/itsy-bitsy-data-structures Um guia sobre estruturas de dados]
 +
* [https://www.timsommer.be/famous-laws-of-software-development/ Leis de desenvolvimento de software famosas ]
  
  
Linha 10: Linha 18:
  
  
Do ponto de vista de uma estrutura de dados usada em programas, uma lista encadeada se aparenta com estes exemplos:
+
Do ponto de vista computacional, podem-se citar estas aplicações de listas:
 +
* '''Armazenar um conjunto de dados cuja quantidade não pode ser conhecida de antemão'''. Exemplos são resultados de consultas a bancos de dados, listagens de arquivos de um diretório, resultados de separação de string em substrings.
 +
* '''Armazenar dados cuja ordem em memória é modificada frequentemente'''. Exemplos são listas de processos em execução mantidas por sistemas operacionais, listas de mensagens a serem transmitidas cuja ordem depende de suas prioridades, listas de tarefas a serem realizadas por um simulador, listas de reprodução em tocadores de músicas.
 +
 
 +
Praticamente todas as linguagens de programação usadas atualmente possuem sua própria implementação de lista. Seguem alguns exemplos:
 +
* [https://docs.oracle.com/javase/7/docs/api/java/util/LinkedList.html Java]
 +
* [https://docs.python.org/3/library/stdtypes.html#list Python]
 +
* [http://www.cplusplus.com/reference/list/list/ C++]
 +
* [http://www.tutorialsteacher.com/csharp/csharp-list C#]
 +
* [http://ruby-doc.org/core-2.5.1/Array.html Ruby]
 +
 
 +
= A lista da STL =
  
[[imagem:prg2-2016-2-Lista1.jpg]]
+
A STL apresenta a estrutura de dados [http://www.cplusplus.com/reference/list/list/ list] para armazenamento de sequências de dados, os quais podem ser acessados randomicamente. Em uma lista, dados podem ser adicionados e removidos de qualquer posição com eficiência, porém são acessados de forma iterativa (sempre a partir do início ou final da lista). Em ''list'', cada dado ocupa uma área de memória sob medida, e para formar uma sequência essas áreas de memória são encadeadas (ligadas). Como consequência, os dados não ficam contíguos em memória. Por exemplo, supondo que tenha sido criada uma lista chamada ''numeros'', e nela tenham sido adicionados os números 10, 20, 30 e 40 (nessa ordem), o armazenamento desses números em memória poderia ser este:
  
  
Uma lista possui algumas características:
+
<br>[[imagem:prg2-Lista.png]]<br>''Uma lista com alguns dados''
* Os dados são armazenados dinamicamente, por isso a quantidade total de memória usada para a lista depende da quantidade de dados nela armazenados (compare isso com um vetor ou matriz).
+
 
* A lista não precisa ocupar uma área de memória contígua: como dados são armazenados dinamicamente, eles podem ocupar áreas de memória arbitrárias, e não há nenhuma relação entre a localização dos dados em memória e sua ordem na lista (novamente compare isso com um vetor ou matriz).
+
 
 +
Em geral, ''list'' é adequada quando a quantidade de dados a serem armazenados é variável e desconhecida, e quando dados precisam ser inseridos e removidos de qualquer posição. Os pontos listados a seguir buscam esclarecer melhor o que está em jogo.
 +
* Não é necessária uma área de memória contígua: como dados são armazenados dinamicamente, eles podem ocupar áreas de memória arbitrárias, e não há nenhuma relação entre a localização dos dados em memória e sua ordem na lista.
 
* Não é possível indexar os dados, por isso para acessar um dado deve-se obrigatoriamente procurá-lo a partir do início ou fim da lista, seguindo cada sucessor ou antecessor até chegar àquele procurado.
 
* Não é possível indexar os dados, por isso para acessar um dado deve-se obrigatoriamente procurá-lo a partir do início ou fim da lista, seguindo cada sucessor ou antecessor até chegar àquele procurado.
* Para adicionar um dado, basta modificar a referência ao sucessor do dado que deve antecedê-lo na lista. Assim, não é necessário ''"empurrar"'' os dados seguintes para frente (como seria o caso de um vetor).
+
* Acrescentar um dado implica modificar a referência ao sucessor do dado que deve antecedê-lo na lista. Assim, não é necessário ''"empurrar"'' os dados seguintes para frente.
* Para remover um dado é a mesma coisa: basta modificar a referência de seu antecessor. Assim, não é necessário ''"deslocar pra trás"'' os dados seguintes (como seria o caso de um vetor).
+
* Para remover um dado é a mesma coisa: basta modificar a referência de seu antecessor. Assim, não é necessário ''"deslocar pra trás"'' os dados seguintes.
  
  
'''Algumas aplicações de listas:'''
+
As operações elementares de ''list'' são:
* '''Armazenar um conjunto de dados cuja quantidade não pode ser conhecida de antemão'''. Exemplos são resultados de consultas a bancos de dados, listagens de arquivos de um diretório, resultados de separação de string em substrings.
+
* [http://www.cplusplus.com/reference/list/list/push_back/ push_back]: Adicionar um dado ao final
* '''Armazenar dados cuja ordem em memória é modificada frequentemente'''. Exemplos são listas de processos em execução mantidas por sistemas operacionais, listas de mensagens a serem transmitidas cuja ordem depende de suas prioridades, listas de tarefas a serem realizadas por um simulador, listas de reprodução em tocadores de músicas.
+
* [http://www.cplusplus.com/reference/list/list/push_front/ push_front]: Adicionar um dado no início
 +
* [http://www.cplusplus.com/reference/list/list/pop_front/ pop_front]: Remover um dado do início
 +
* [http://www.cplusplus.com/reference/list/list/pop_back/ pop_back]: Remover um dado do final
 +
* [http://www.cplusplus.com/reference/list/list/insert/ insert]: Inserir um dado em uma determinada posição
 +
* [http://www.cplusplus.com/reference/list/list/erase/ erase]: Remover um ou mais dados a partir de uma determinada posição
 +
* [http://www.cplusplus.com/reference/list/list/front/ front]: Acessar o dado que está no início
 +
* [http://www.cplusplus.com/reference/list/list/back/ back]: Acessar o dado que está no final
 +
* [http://www.cplusplus.com/reference/list/list/size/ size]: Obter a quantidade de dados armazenados
 +
* [http://www.cplusplus.com/reference/list/list/clear/ clear]: Remover todos os dados (esvaziar)
 +
 
 +
 
 +
Abaixo segue um exemplo de uso de algumas operações de ''list'':
 +
 
 +
<syntaxhighlight lang=c++>#include <cstdlib>
 +
#include <list>
 +
#include <iostream>
 +
#include <string>
 +
 
 +
using namespace std;
 +
 
 +
void mostra_lista(list<string> & lista) {
 +
    // itera a lista
 +
    for (auto & dado: lista) {
 +
      cout << dado << ",";
 +
    }
 +
    cout << endl;
 +
}
 +
 
 +
int main(int argc, char** argv) {
 +
    // cria uma lista de string
 +
    list<string> nomes;
 +
   
 +
    // anexa três dados ao final da lista
 +
    nomes.push_back("manuel");
 +
    nomes.push_back("maria");
 +
    nomes.push_back("bilica");
 +
   
 +
    // mostra comprimento e conteúdo da lista
 +
    cout << "Comprimento: " << nomes.size() << ", dados: ";
 +
    mostra_lista(nomes);
 +
 
 +
    // insere dado no início da lista
 +
    nomes.push_front("maneca");
 +
    cout << "Comprimento: " << nomes.size() << ", dados: ";
 +
    mostra_lista(nomes);
 +
 
 +
    // remove dado do início da lista
 +
    nomes.pop_front();
 +
    cout << "Comprimento: " << nomes.size() << ", dados: ";
 +
    mostra_lista(nomes);
 +
   
 +
    // ao final, lista é automaticamente destruída, e a memória utilizada
 +
    // é liberada
 +
    return 0;
 +
}</syntaxhighlight>
 +
 
 +
 
 +
Ao usar essa nova estrutura de dados, existem algumas novidades em comparação com a fila e a pilha. A primeira delas diz respeito à iteração da lista. Tanto a fila quanto a pilha possibilitavam acessar apenas os dados em suas extremidades. A lista é muito mais flexível, possibilitando acessar dados em qualquer posição. No entanto, devido à forma como os dados ficam armazenados dentro da lista, para acessá-los é necessário usar um ''iterador''.  
 +
 
 +
== Iteradores ==
 +
* [https://wiki.sj.ifsc.edu.br/index.php/Introdu%C3%A7%C3%A3o_C%2B%2B#Exce.C3.A7.C3.B5es Exceções: avisos de erros ou situações inesperadas em um programa]
 +
 
 +
Quando se necessitam acessar em sequência todos (ou uma boa parte) dos dados de uma lista, a melhor forma é por meio da operação de iteração. A lista é capaz de ser iterada por meio de um '''iterador'''. Um ''iterador'' é um objeto que se assemelha a um ponteiro, e que possibilita acessar um dado da lista, além de avançar para o dado seguinte ou retroceder para o dado anterior. As operações [http://www.cplusplus.com/reference/list/list/begin/ begin] e [http://www.cplusplus.com/reference/list/list/end/ end] da lista retornam, respectivamente, iteradores para o início ou fim da lista. O exemplo a seguir mostra como usá-los:
 +
 
 +
<syntaxhighlight lang=c>
 +
#include <iostream>
 +
#include <list>
 +
 
 +
using namespace std;
 +
 
 +
int main() {
 +
  list<int> numeros;
  
 +
  numeros.push_back(34);
 +
  numeros.push_back(7);
 +
  numeros.push_back(21);
 +
  numeros.push_back(8);
 +
  numeros.push_back(12);
 +
  numeros.push_back(17);
  
As operações elementares de uma lista definem como dados podem ser adicionados, obtidos e removidos da lista, e também que informações sobre a lista podem ser obtidas. São elas:
+
  // Itera do início ao fim da lista
* ''anexa'': adiciona um dado ao final da lista
+
  // A variável "it" é o iterador, que será usado para acessar os dados da lista
* ''insere'': adiciona um dado em uma determinada posição da lista
+
  // Note como ao final de cada repetição do laço o iterador é incrementado ... isso
* ''remove'': remove um dado de uma determinada posição da lista
+
  // faz com que se avance para o próximo dado da lista
* ''obtem'': obtém um dado de uma determinada posição da lista
 
* ''comprimento:'' obtém o comprimento da lista
 
* ''esvazia'': esvazia a lista (remove todos os dados)
 
  
 +
  for (auto it = numeros.begin(); it != numeros.end(); it++) {
 +
    // acessa o dado atual da iteração: ele é referenciado pelo iterador,
 +
    // como se este fosse um ponteiro
  
A biblioteca Prglib possui uma lista,cuja declaração é apresentada a seguir:
+
    cout << "Numero: " << *it << endl;
 +
  }
 +
}
 +
</syntaxhighlight>
 +
 
 +
 
 +
Para fins de simplicidade, existe uma sintaxe na linguagem para iterar sequências de dados. Veja o exemplo anterior com essa forma de iterar:
  
{{collapse top | A lista encadeada da biblioteca Prglib}}
 
 
<syntaxhighlight lang=c>
 
<syntaxhighlight lang=c>
#ifndef LISTA_H
+
#include <iostream>
#define LISTA_H
+
#include <list>
 +
 
 +
using namespace std;
 +
 
 +
int main() {
 +
  list<int> numeros;
 +
 
 +
  numeros.push_back(34);
 +
  numeros.push_back(7);
 +
  numeros.push_back(21);
 +
  numeros.push_back(8);
 +
  numeros.push_back(12);
 +
  numeros.push_back(17);
 +
 
 +
  // Itera do início ao fim da lista
 +
  // O iterador é usado implicitamente. Por isso, no laço a variável de controle
 +
  // acessa diretamente o dado atual da iteração (no caso, a variável "x").
 +
 
 +
  for (auto & x: numeros) {
 +
    // "x" contém o dado atual da iteração
 +
    cout << "Numero: " << x << endl;
 +
  }
 +
}
 +
</syntaxhighlight>
  
#include <cstddef>
+
 
#include <ostream>
+
Deve-se observar que isso é específico de C++: não há algo parecido na linguagem C ! Porém, essa forma simplificada de iterar sequências aparece em outras linguagens (ex: [https://towardsdatascience.com/python-basics-iteration-and-looping-6ca63b30835c Python]).
#include <string>
+
 
 +
=== Iteração reversa ===
 +
 
 +
A iteração pode ser feita também em sentido contrário, se for usado um iterador reverso. Os métodos [http://www.cplusplus.com/reference/list/list/rbegin/ rbegin] e [http://www.cplusplus.com/reference/list/list/rend/ rend] de ''list'' retornam, respectivamente, iteradores reversos para o fim e início da lista:
 +
 
 +
<syntaxhighlight lang=c>
 +
#include <iostream>
 
#include <list>
 
#include <list>
#include <algorithm>
 
#include <random>
 
  
using std::shared_ptr;
+
using namespace std;
 +
 
 +
int main() {
 +
  list<int> numeros;
 +
 
 +
  numeros.push_back(34);
 +
  numeros.push_back(7);
 +
  numeros.push_back(21);
 +
  numeros.push_back(8);
 +
  numeros.push_back(12);
 +
  numeros.push_back(17);
 +
 
 +
  // Itera do início ao fim da lista
 +
  // A variável "it" é o iterador, que será usado para acessar os dados da lista
 +
  // Note como ao final de cada repetição do laço o iterador é incrementado ... isso
 +
  // faz com que se retorceda para o próximo dado da lista
  
namespace prglib {
+
  for (auto it = numeros.rbegin(); it != numeros.rend(); it++) {  
 +
    // acessa o dado atual da iteração: ele é referenciado pelo iterador,
 +
    // como se este fosse um ponteiro
  
template <typename T> class lista {
+
    cout << "Numero: " << *it << endl;
   
+
  }
  public:
+
}
  //construtor: não precisa de parâmetros para criar uma nova lista
+
</syntaxhighlight>
  lista();
+
 
 
+
 
  // construtor de cópia
+
A sintaxe para iteração simplificada não se aplica à iteração reversa !
  lista(const lista &outra);
+
 
 
+
== Atividade ==
  // destrutor
+
 
  virtual ~lista();
+
'''Objetivo:''' escrever um programa que mescle as informações contidas em diferentes arquivos, eliminando informações repetidas
 
+
* ''Descrição'': existe um conjunto de arquivos, os quais contêm dados sobre alunos de uma escola. Cada arquivo corresponde a uma disciplina de algum curso dessa escola.  Cada linha desses arquivos tem este formato:
  // insere "algo" no inicio da lista
+
 
  void insere(const T & algo);
+
  matrícula aluno
 +
 
 +
... sendo ''matrícula'' um número com 8 dígitos, e ''aluno'' o nome completo de um aluno.<br><br>Há a necessidade de obter uma relação dos alunos matriculados nessas disciplinas, sendo que cada aluno deve aparecer uma única vez.
 +
 
 +
 
 +
Para se familiarizar com o uso de listas, resolva primeiro estes exercícios:
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_Numeros_Inteiros Lista de números inteiros]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_CopiaLista Copiar uma lista usando iteração]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_Junta Junta strings contidas em uma lista]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_FiltraValores Filtra valores de uma lista]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_Contadores Lista de contadores]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_PalavrasRepetidas Palavras repetidas]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_ContadorPalavras Contador de palavras]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_Separa A função separa usando lista]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_CompactadorIPv6 Compactador de endereço IPv6]
 +
 
 +
== Um resumo sobre a notação para complexidade de algoritmos ==
 +
 
 +
[[imagem:Prg2-Big-o-table.jpg]]
 +
<br>''Figura obtida [https://apirobot.me/posts/lets-talk-about-data-structures-in-python deste artigo sobre estruturas de dados em Python]''
 +
 
 +
= Operações que reorganizam a lista =
 +
 
 +
Três operações disponíveis na lista reorganizam a ordem dados dados armazenados:
 +
* '''ordenamento''': ordena os dados de forma eficiente
 +
* '''embaralhamento''': mistura os dados aleatoriamente
 +
* '''inversão''': inverte a ordem dos dados
 +
 
 +
== Ordenamento da lista ==
 +
 
 +
A lista possui o método ''sort'', que ordena seus dados. O ordenamento é feito por um [https://en.wikipedia.org/wiki/Merge_sort algoritmo] com razoável eficiência (ele tem custo de tempo computacional ''O(n log n)''), e isso é importante porque esse tipo de operação tem custo computacional considerável (pode ser proporcional ao quadrado da quantidade de dados se não for bem feito). O único requisito para ordenar uma lista é que os dados armazenados possuam uma relação de precedência. Em outras palavras, que possam ser comparados com operador ''<'' (menor que). O exemplo a seguir mostra o ordenamento de uma lista:
 +
 
 +
<syntaxhighlight lang=c>
 +
#include <iostream>
 +
#include <list>
  
  // adiciona "algo" no final da lista
+
using namespace std;
  void anexa(const T & algo);
 
 
 
  // insere "algo" em uma posição específica da lista 
 
  void insere(const T & algo, int posicao);
 
  void insereOrdenado(const T & algo);
 
 
 
  // remove o dado que está na "posicao" na lista, e retorna
 
  // uma cópia desse dado
 
  virtual T remove(int posicao);
 
 
 
  // remove todos os dados que forem equivalentes a "algo"
 
  void retira(const T & algo);
 
 
 
  // estas duas operações são idênticas: retorna
 
  // uma referência ao dado que está na "posicao" na lista
 
  T& obtem(int posicao) const;
 
  T& operator[](int pos) const;
 
 
  // atribuição: torna esta lista idêntica à outra lista
 
  virtual lista& operator=(const lista<T> & outra);
 
 
 
  // compara duas listas: são iguais se tiverem mesmo comprimento
 
  // E todos os dados armazenados forem iguais e na mesma ordem
 
  bool operator==(const lista<T> & outra) const;
 
 
 
  // Retorna uma referência a um dado que seja equivalente a "algo"
 
  T& procura(const T &algo) const;  
 
  
  // Procura todos os dados equivalentes a "algo", e os
+
int main() {
   // anexa a "lista". Retorna uma referência a "lista".
+
   list<int> numeros;
  lista<T> & procuraMuitos(const T &algo, lista<T> & lista) const;
 
  
   // retorna a quantidade de dados armazenados na lista
+
   numeros.push_back(34);
   int comprimento() const;
+
   numeros.push_back(7);
    
+
   numeros.push_back(21);
   // retorna true se lista estiver vazia
+
   numeros.push_back(8);
   bool vazia() const;
+
   numeros.push_back(12);
    
+
   numeros.push_back(17);
  // Esvazia a lista
 
  void esvazia();
 
  
  // apresenta o conteúdo da lista no stream "out"
 
  void escrevaSe(std::ostream & out) const;
 
  void escrevaSe(std::ostream & out, const std::string & delim) const;
 
 
 
 
   // ordena a lista
 
   // ordena a lista
   void ordena();
+
   numeros.sort();
    
+
 
   // iteração do início pro fim
+
  // mostra o conteúdo da lista
   void inicia();
+
  for (auto & x: numeros) {
   T & proximo();
+
    cout << x << endl;
   bool fim() const;
+
   }
 +
 
 +
   cout << endl;
 +
}
 +
</syntaxhighlight>
 +
 
 +
Como o método ''sort'' depende da existência do operador ''<'' para o tipo dos dados armazenados, as [[PRG29003:_Introdu%C3%A7%C3%A3o_a_Listas#Compara.C3.A7.C3.A3o_de_igualdade|mesmas considerações feitas quanto à operação de igualdade]] se aplicam aqui. A próxima subseção mostra um exemplo de ordenamento de uma lista que contém valores de um tipo definido pelo programador.
 +
 
 +
=== Ordenamento de uma lista com valores de um tipo definido pelo programador ===
 +
 
 +
A operação ''sort'' depende da comparação de precedência dos dados contidos numa lista. Isso pode ser feito usando o operador ''<'' para o tipo desses dados (caso exista), ou uma função de comparação específica para essa finalidade. O operador ''<'' existe na linguagem para tipos básicos, tais como ''int'', ''float'', ''char'' e outros. Mas o mesmo não vale para tipos de dados definidos pelo programador, ou mesmo classes. Nesse caso, o '''programador deve definir o operador ''<'' ''', pois somente ele sabe como valores desses tipos devem ser comparados. Observe-se também que a comparação dos dados não é um problema da ''lista'', que apenas usa a comparação. Em suma, cada tipo e dados ou classe deve saber como comparar seus valores ou objetos, ou deve existir uma função para fazer essa comparação.
 +
 
 +
O caso mais simples envolve escrever uma função que compare valores do tipo de dados em questão. O exemplo a seguir mostra como essa função deve ser declarada, e depois como ela pode ser utilizada para fazer o ordenamento.
 +
 
 +
<syntaxhighlight lang=c>
 +
// compara duas strings de acordo com seus comprimentos
 +
bool comp_comprimento(cons string & s1, const string & s2) {
 +
  return s1.size() < s2.size();
 +
}
 +
 
 +
int main() {
 +
  list<string> l;
 +
 
 +
  l.push_back("banana");
 +
  l.push_back("caju");
 +
   l.push_back("laranja");
 +
   l.push_back("cajamanga");
 +
 
 +
  // ordena lista de string de acordo com comprimentos das string
 +
  l.sort(comp_comprimento);
 +
 
 +
   // mostra conteúdo da lista na tela
 +
  for (auto & w: l) {
 +
    cout << w << endl;
 +
  }
 +
}
 +
</syntaxhighlight>
 +
 
 +
 
 +
A linguagem C++ possibilita definir como um determinado operador deve funcionar. Isso aplicado ao operador ''<'' resolve o problema da comparação de um tipo de dados definido pelo programador. A implementação de um operador pode ser feita de duas maneiras:
 +
# '''Incluindo-o ao tipo struct ou à classe''': <syntaxhighlight lang=c>
 +
struct Registro {
 +
  // atributos do tipo Registro
  
  // ... e do fim pro início
+
   bool operator<(const Registro & outro) const;
  void iniciaPeloFim();
 
  T & anterior();
 
   bool inicio() const;
 
 
 
  // inverte a ordem nos nodos na lista
 
  void inverte();
 
 
 
  // embaralha os dados de uma lista
 
  void embaralha();
 
 
 
  // obtém uma sublista
 
  lista<T> * sublista(unsigned int pos1, unsigned int pos2) const;
 
  lista<T> & sublista(unsigned int pos1, unsigned int pos2, lista<T> & outra) const;
 
 
};
 
};
 
</syntaxhighlight>
 
</syntaxhighlight>
{{collapse bottom}}
+
# '''Criando uma função''': <syntaxhighlight lang=c>
 +
// compara "este" com "outro"
 +
bool operator<(const Registro & este, const Registro & outro) const {
 +
  // implementação da comparação: verifica se "este" < "outro"
 +
}
 +
</syntaxhighlight>
 +
 
 +
 
 +
Ambas as formas de implementar um operador são válidas e resolvem o problema. Uma observação diz respeito à implementação com uma função, a qual tem precedência sobre a implementação  dentro da struct ou classe. Isso significa que mesmo que já exista o operador em questão definido dentro de uma struct ou classe, ele pode ser substituído por outra implementação desse operador em uma função. A isso se chama [[Introdu%C3%A7%C3%A3o_C%2B%2B#Sobrecarga_de_operador|sobrecarga de operador]].
  
  
Abaixo segue um exemplo de uso de algumas operações de uma lista:
+
O exemplo a seguir mostra um programa que cria uma lista com valores de um novo tipo de dados, e a ordena.
  
 +
{{collapse top|Exemplo com o operador< como um método do novo tipo de dados}}
 
<syntaxhighlight lang=c>
 
<syntaxhighlight lang=c>
#include <cstdlib>
 
#include <prglib.h>
 
 
#include <iostream>
 
#include <iostream>
 
#include <string>
 
#include <string>
 
+
#include <list>
 +
 
using namespace std;
 
using namespace std;
using prglib::lista;
 
  
int main(int argc, char** argv) {
+
// Tipo Alguem: representa uma pessoa com seu nome e idade
    // cria uma lista de string
+
struct Alguem {
     lista<string> nomes;
+
    string nome;
 +
    int idade;
 +
   
 +
    Alguem() {
 +
        idade = 0;       
 +
     }
 
      
 
      
     // anexa três dados ao final da lista
+
     Alguem(const string & umNome, int age) {
    nomes.anexa("manuel");
+
        nome = umNome;
    nomes.anexa("maria");
+
        idade = age;
     nomes.anexa("bilica");
+
     }
 
      
 
      
     // mostra comprimento e conteúdo da lista
+
     // sobrecarga do operador< para o tipo Alguem
     cout << "Comprimento: " << nomes.comprimento() << ", dados: ";
+
     bool operator<(const Alguem & o) {
    nomes.escrevaSe(cout, ",");
+
        if (idade == o.idade) {
     cout << endl;
+
            return nome < o.nome;
 +
        }
 +
        return idade < o.idade;
 +
     }
 
      
 
      
    // insere dado no início da lista
+
};
    nomes.insere("maneca");
 
    cout << "Comprimento: " << nomes.comprimento() << ", dados: ";
 
    nomes.escrevaSe(cout, ",");
 
    cout << endl;
 
  
    // insere dado na posição 2 da lista
+
int main() {
    nomes.insere("joaquim", 2);
+
  list<Alguem> l;
    cout << "Comprimento: " << nomes.comprimento() << ", dados: ";
+
 
    nomes.escrevaSe(cout, ",");
+
  Alguem joao("Joao", 20);
    cout << endl;
+
  l.push_back(joao);
 +
 
 +
  Alguem x1("Amanda", 15);
 +
  l.push_back(x1);
 +
 
 +
  Alguem x2("Gabriel", 19);
 +
  l.push_back(x2);
 +
 
 +
  l.push_back(Alguem("Isadora", 18));
 +
  l.push_back(Alguem("Gustavo", 18));
 +
 
 +
  // ordena a lista
 +
  l.sort();
 +
 +
  // mostra a lista ...
 +
  for (auto & pessoa: l) {
 +
    cout << pessoa.nome << ": " << pessoa.idade << endl;
 +
  }
 +
 
 +
  cout << endl;
 +
}
 +
</syntaxhighlight>
 +
{{collapse bottom}}
 +
{{collapse top|Exemplo do operador< como uma função}}
 +
<syntaxhighlight lang=c>
 +
#include <iostream>
 +
#include <string>
 +
#include <list>
 +
 +
using namespace std;
  
    // remove dado do início da lista
+
// Tipo Alguem: representa uma pessoa com seu nome e idade
    nomes.remove(0);
+
struct Alguem {
    cout << "Comprimento: " << nomes.comprimento() << ", dados: ";
+
     string nome;
     nomes.escrevaSe(cout, ",");
+
     int idade;
     cout << endl;
 
 
      
 
      
     // remove dado da posição 2 da lista
+
     Alguem() {
    nomes.remove(2);
+
        idade = 0;      
    cout << "Comprimento: " << nomes.comprimento() << ", dados: ";
+
     }
    nomes.escrevaSe(cout, ",");
 
     cout << endl;
 
 
      
 
      
     // esvazia a lista
+
     Alguem(const string & umNome, int age) {
    nomes.esvazia();
+
        nome = umNome;
     cout << "Comprimento: " << nomes.comprimento() << ", dados: ";
+
        idade = age;
     nomes.escrevaSe(cout, ",");
+
     }       
    cout << endl;
+
};
       
+
 
    // ao final, lista é automaticamente destruída, e a memória utilizada
+
// sobrecarga do operador< para o tipo Alguem
     // é liberada
+
bool operator<(const Alguem & este, const Alguem & outro) {
     return 0;
+
     if (este.idade == outro.idade) {
 +
        return este.nome < outro.nome;
 +
     }
 +
     return este.idade < outro.idade;
 
}
 
}
</syntaxhighlight>
 
  
= Atividade =
 
  
[http://tele.sj.ifsc.edu.br/~msobral/prg2/Prg2.zip O arquivo de projeto do Netbeans com a biblioteca Prglib]
+
int main() {
 +
  list<Alguem> l;
 +
 
 +
  Alguem joao("Joao", 20);
 +
  l.push_back(joao);
 +
 
 +
  Alguem x1("Amanda", 15);
 +
  l.push_back(x1);
 +
 
 +
  Alguem x2("Gabriel", 19);
 +
  l.push_back(x2);
 +
 
 +
  l.push_back(Alguem("Isadora", 18));
 +
  l.push_back(Alguem("Gustavo", 18));
 +
 
 +
  // ordena a lista
 +
  l.sort();
 +
 +
  // mostra a lista ...
 +
  for (auto & pessoa: l) {
 +
    cout << pessoa.nome << ": " << pessoa.idade << endl;
 +
  }
 +
 
 +
  cout << endl;
 +
}
 +
</syntaxhighlight>
 +
{{collapse bottom}}
  
 +
<!--== Embaralhamento ==
  
# Faça os [http://moodlenovo.sj.ifsc.edu.br/course/view.php?id=92 exercícios sobre listas que estão no Moodle], para se familiarizar com listas
+
O embaralhamento envolve misturar eficientemente os dados da lista de forma aleatória. O algoritmo envolvido tem custo de tempo computacional ''O(n log n)''. Esse método está declarado assim na classe lista:
  
= Outras operações da lista =
+
<syntaxhighlight lang=c>
 +
  // embaralha os dados de uma lista
 +
  void embaralha();
 +
</syntaxhighlight>
  
A lista encadeada da Prglib ofere outras operações além daquelas para adicionar, obter e remover dados. Duas outras operações são de grande utilidade:
+
Seu uso é direto, e não há dependência a qualquer operador do tipo dos dados armazenados. Um exemplo de uso é este:
* '''iteração''': possibilita obter sucessivamente de forma eficiente os dados da lista;
 
* '''ordenamento''': ordena os dados de forma eficiente
 
 
 
== Iteração ==
 
 
 
Quando se necessitam acessar em sequência todos (ou uma boa parte) dos dados de uma lista, a melhor forma é por meio da operação de iteração. A lista é capaz de ser iterada por meio dos métodos ''inicia'', ''proximo'' e ''fim''. Esses métodos são usados em conjunto para acessar cada dado da lista sucessivamente, a partir do início da lista. O exemplo a seguir mostra como usá-los:
 
  
 
<syntaxhighlight lang=c>
 
<syntaxhighlight lang=c>
Linha 238: Linha 476:
 
   numeros.anexa(17);
 
   numeros.anexa(17);
  
   // inicia a iteração
+
   // embaralha a lista
   numeros.inicia();
+
   numeros.embaralha();
  
   // enquanto não chegar ao fim da lista, continua a iteração
+
   numeros.escrevaSe(cout);
  while (not numeros.fim()) {
 
    // obtém o próximo dado da iteração
 
    int algo = numeros.proximo();
 
  
    cout << "Numero: " << algo << endl;
+
  cout << endl;
  }
 
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
 +
-->
  
 +
== Inversão ==
  
Essa forma de percorrer os dados de uma lista é muito mais eficiente do que acessar os dados a partir de suas posições (usando o método ''obtem'' ou o operador ''[]''). Para ter uma ideia, percorrer uma lista com 10 dados é 10 vezes mais rápido com iteração. Se a lista tiver 100 dados, a iteração é 100 vezes mais rápida. Se a lista tiver 1000 dados, a uteração é 1000 vezes mais rápida, e assim por diante. O tempo que se leva para percorrer todos os dados com iteração é proporcional à quantidade de dados, porém se for usado o método ''obtem'' (ou operador ''[]''), o tempo necessário é proporcional ao quadrado da quantidade de dados.
+
A inversão da lista, implementada pela operação [http://www.cplusplus.com/reference/list/list/reverse/ reverse], envolve inverter a ordem dos dados nela armazenados: o primeiro se torna o último, o segundo o penúltimo, e assim por diante. O algoritmo envolvido tem custo de tempo computacional ''O(n)''.
  
A iteração pode ser feita também em sentido contrário se forem usados os métodos ''iniciaPeloFim'', ''anterior'', e ''inicio'':
+
Seu uso é direto, e não há dependência a qualquer operador do tipo dos dados armazenados. Um exemplo de uso é este:
  
 
<syntaxhighlight lang=c>
 
<syntaxhighlight lang=c>
 
#include <iostream>
 
#include <iostream>
#include <prglib.h>
+
#include <list>
  
 
using namespace std;
 
using namespace std;
using prglib::lista;
 
  
 
int main() {
 
int main() {
   lista<int> numeros;
+
   list<int> numeros;
  
   numeros.anexa(34);
+
   numeros.push_back(34);
   numeros.anexa(7);
+
   numeros.push_back(7);
   numeros.anexa(21);
+
   numeros.push_back(21);
   numeros.anexa(8);
+
   numeros.push_back(8);
   numeros.anexa(12);
+
   numeros.push_back(12);
   numeros.anexa(17);
+
   numeros.push_back(17);
  
   // inicia a iteração pelo fim da lista
+
   // ordena a lista
   numeros.iniciaPeloFim();
+
   numeros.sort();
  
   // enquanto não chegar ao início da lista, continua a iteração
+
   // ... e agora a inverte, para obter um ordenamento decrescente
   while (not numeros.inicio()) {
+
   numeros.reverse();
    // obtém o próximo dado da iteração
 
    int algo = numeros.anterior();
 
  
     cout << "Numero: " << algo << endl;
+
  // apresenta a lista
 +
  for (auto & x: numeros) {
 +
     cout << x << endl;
 
   }
 
   }
 +
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
  
== Ordenamento da lista ==
+
== Atividade ==
  
A lista possui o método ''ordena'', que ordena seus dados. O ordenamento é feito por um [https://en.wikipedia.org/wiki/Merge_sort algoritmo] com razoável eficiência, e isso é importante porque esse tipo de operação tem custo computacional considerável (pode ser proporcional ao quadrado da quantidade de dados se não for bem feito). O único requisito para ordenar uma lista é que os dados armazenados possuam uma relação de precedência. Em outras palavras, que possam ser comparados com operador ''<'' (menor que). O exemplo a seguir mostra o ordenamento de uma lista:
+
Faça estes exercícios que envolvem ordenamento:
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_ListaOrdenadaInteiros Lista ordenada de números inteiros]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_OrdenarLinhasArquivo Ordenar linhas de um arquivo]
 +
# [https://github.com/IFSC-Engtelecom-Prg2/Lista_OrdenarLinhasPorComprimento Ordenar linhas de um arquivo de acordo com comprimentos das linhas]
  
 +
<!--
 +
{{collapse top | Uma solução para o exercício 3}}
 
<syntaxhighlight lang=c>
 
<syntaxhighlight lang=c>
 +
#include <fstream>
 
#include <iostream>
 
#include <iostream>
#include <prglib.h>
+
#include <list>
  
 
using namespace std;
 
using namespace std;
using prglib::lista;
 
  
int main() {
+
// Este novo tipo de dados foi criado para possibilitar comparar
   lista<int> numeros;
+
// strings pelos seus comprimentos.
 +
// Note que o tipo Linha apenas encapsula uma string (campo string s),
 +
// e define o operador <
 +
 
 +
struct Linha {
 +
  // a string encapsulada
 +
  string s;
 +
 
 +
  Linha() {}
 +
  Linha(const string & algo) {
 +
    s = algo;
 +
  }   
 +
};
 +
 
 +
// o operador < compara as strings s1 e s2 (s1 < s2)
 +
// a comparação é feita pelos comprimentos das strings encapsuladas
 +
bool operator<(const Linha & s1, const Linha & s2) {
 +
   return s1.s.size() < s2.s.size();
 +
}
 +
 
 +
int main(int argc, char * argv[]) {
 +
    // implemente aqui seu programa
 +
    ifstream arq(argv[1]);
  
  numeros.anexa(34);
+
    // Cria uma lista de Linha, para ser possível ordenar pelo comprimento de string
  numeros.anexa(7);
+
    list<Linha> l;
  numeros.anexa(21);
 
  numeros.anexa(8);
 
  numeros.anexa(12);
 
  numeros.anexa(17);
 
  
  // ordena a lista
+
    string x;
  numeros.ordena();
+
   
 +
    // para cada linha lida e guardada na variável "x"
 +
    while (getline(arq, x)) l.push_back(x);
  
  numeros.escrevaSe(cout);
+
    // ordena a lista: a comparação entre os valores armazenados será feita usando o
 +
    // operador < do tipo Linha
 +
    l.sort();
 +
   
 +
    // Usa iteração para apresentar o conteúdo da lista na tela
 +
    for (auto & linha: l) {       
 +
        cout << linha.s << endl;
 +
    }
  
  cout << endl;
+
    return 0;
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
 +
{{collapse bottom}}
 +
-->
 +
 +
== Curiosidade: contando quantas vezes cada valor existe em uma lista ==
 +
 +
Em um projeto sobre estatísticas sobre filmes e atores, ralizado em 2019.2, o requisito ''"listar os atores que mais atuaram, por ordem decrescente de atuações em filmes"'' poderia ser resolvido de mais de uma maneira. Uma abordagem é criar uma lista contendo todos os nomes de atores que atuaram nos filmes, de forma que, se um ator trabalhou em três filmes, seu nome apareceria três vezes nessa lista. Basicamente isso implica listar os atores de cada filme, e acrescentá-los a essa nova lista. Ao final, bastaria contar quantas vezes cada ator aparece na lista.
 +
 +
Ao menos dois algoritmos podem ser pensados para esse problema:
 +
# Para cada ator da lista, iterar a lista para contar quantas vezes seu nome aparece. Há que cuidar para realizar essa procura somente para a primeira vez em que cada ator é avaliado.
 +
# Ordenar a lista de atores, e então iterá-la. Os nomes de atores ficarão contíguos, o que facilita contá-los. Se o próximo ator da iteração for diferente do anterior, então registra-se a contagem do ator anterior e reinicia-se o contador.
 +
 +
 +
Qual dos dois algoritmos é melhor, do ponto de vista de custo computacional (tempo para que concluam) ? O gráfico abaixo responde essa questão !
 +
 +
[[imagem:PRG2-Conta_repetidos.png]]
 +
<br>''Custo computacional dos algoritmos para contar valores repetidos em uma lista, para listas de números inteiros''
 +
 +
= Uma alternativa à lista: vetor dinâmico =
 +
 +
A STL apresenta uma outra estrutura de dados linear chamada [http://www.cplusplus.com/reference/vector/vector vector]. Essa estrutura se apŕesenta como um vetor dinâmico, em que dados são armazenados de forma parecida com um vetor, porém cuja área de armazenamento em memória pode ser expandida automaticamente. Em ''vector'', os dados estão sempre contíguos em memória. Um ''vector'' usa uma área de memória capaz de guardar a quantidade de dados armazenados, estando os dados gravados sequencialmente ali dentro. A figura a seguir mostra como um vector usa memória para armazenar dados.
 +
 +
[[imagem:Prg2-Vector.png]]
 +
<br>''Um vector com alguns dados armazenados''
 +
 +
 +
Em geral, ''vector'' é adequado quando os dados são armazenados e removidos do final da área de armazenamento, e também quando se precisam acessá-los diretamente (por suas posições) e/ou aleatoriamente. Com ''list'' é o contrário, pois ela é adequada quando dados precisam ser inseridos e removidos de qualquer posição. Cabe ao programador escolher a estrutura mais adequada em cada situação. Os pontos listados a seguir buscam esclarecer melhor o que está em jogo.
 +
* Com ''list'', não é necessária uma área de memória contígua: como dados são armazenados dinamicamente, eles podem ocupar áreas de memória arbitrárias, e não há nenhuma relação entre a localização dos dados em memória e sua ordem na lista. No caso de ''vector'', a localização dos dados em memória está diretamente ligada a suas posições na área de armazenamento.
 +
* Com ''list'' não é possível indexar os dados, por isso para acessar um dado deve-se obrigatoriamente procurá-lo a partir do início ou fim da lista, seguindo cada sucessor ou antecessor até chegar àquele procurado.
 +
* Com ''vector'' podem-se indexar os dados, acessando-os diretamente por suas posições, uma vez que suas localizações em memória podem ser calculadas em função de suas posições.
 +
* Com ''list'', acrescentar uma dado implica modificar a referência ao sucessor do dado que deve antecedê-lo na lista. Assim, não é necessário ''"empurrar"'' os dados seguintes para frente (como seria o caso quando se usa ''vector'').
 +
* Para remover um dado é a mesma coisa: basta modificar a referência de seu antecessor. Assim, não é necessário ''"deslocar pra trás"'' os dados seguintes (como seria o caso de ''vector'').
 +
 +
 +
As operações que podem ser feitas em ''vector'' são parecidas com as operações de ''list''.
 +
* [http://www.cplusplus.com/reference/vector/vector/push_back/ push_back]: Adicionar um dado ao final
 +
* [http://www.cplusplus.com/reference/vector/vector/insert/ insert]: Inserir um dado em uma determinada posição
 +
* [http://www.cplusplus.com/reference/vector/vector/erase/ erase]: Remover um ou mais dados a partir de uma determinada posição
 +
* [http://www.cplusplus.com/reference/vector/vector/front/ front]: Acessar o dado que está no início
 +
* [http://www.cplusplus.com/reference/vector/vector/operator%91%93/ operador <nowiki>[]</nowiki>]: Acessar um dado em uma posição qualquer
 +
* [http://www.cplusplus.com/reference/vector/vector/back/ back]: Acessar o dado que está no final
 +
* [http://www.cplusplus.com/reference/vector/vector/size/ size]: Obter a quantidade de dados armazenados
 +
* [http://www.cplusplus.com/reference/vector/vector/clear/ clear]: Remover todos os dados (esvaziar)
 +
 +
 +
Abaixo segue um exemplo de uso de algumas operações de ''vector'':
 +
 +
<syntaxhighlight lang=c++>
 +
#include <cstdlib>
 +
#include <vector>
 +
#include <iostream>
 +
#include <string>
 +
 +
using namespace std;
 +
 +
void mostra_vetor(vector<string> & v) {
 +
    // itera o vetor
 +
    for (auto & dado: v) {
 +
      cout << dado << ",";
 +
    }
 +
    cout << endl;
 +
}
 +
 +
int main(int argc, char** argv) {
 +
    // cria um vector de string
 +
    vector<string> nomes;
 +
   
 +
    // anexa três dados ao final do vector
 +
    nomes.push_back("manuel");
 +
    nomes.push_back("maria");
 +
    nomes.push_back("bilica");
 +
   
 +
    // mostra comprimento e conteúdo do vector
 +
    cout << "Comprimento: " << nomes.size() << ", dados: ";
 +
    mostra_vetor(nomes);
 +
 +
    // Acessa um dado por sua posição
 +
    for (int i=0; i < v.size(); i++) {
 +
      cout << "Dado na posição " << i << ": " << nomes[i] << endl;
 +
    }
 +
 +
    // remove dado do final do vector
 +
    nomes.pop_back();
 +
    cout << "Comprimento: " << nomes.size() << ", dados: ";
 +
    mostra_vetor(nomes);
 +
   
 +
    // ao final, vector é automaticamente destruído, e a memória utilizada
 +
    // é liberada
 +
    return 0;
 +
}</syntaxhighlight>
 +
  
= Atividade =
+
Nem tudo que se pode fazer com ''list'' está disponível em ''vector'':
 +
* '''Ordenamento''': não há uma operação de ordenamento para ''vector'', porém é possível ordená-los por meio de um [http://www.cplusplus.com/reference/algorithm/sort/ algoritmo] existente na STL.
 +
* '''Embaralhamento:''' não existe uma operação para embaralhar os dados em um ''vector'', mas também há um [http://www.cplusplus.com/reference/algorithm/random_shuffle/ algoritmo para essa finalidade] na STL.
 +
* '''Reversão''': não há operação para inverter as ordens dos dados, o que também depende de um [http://www.cplusplus.com/reference/algorithm/reverse/ algoritmo] da STL.
 +
* ... e algumas outras operações de ''list'' !
  
Faça estes exercícios que envolvem iteração:
 
# [https://moodle.sj.ifsc.edu.br/mod/vpl/view.php?id=3379 Copiar uma lista usando iteração]
 
# [https://moodle.sj.ifsc.edu.br/mod/vpl/view.php?id=3407 Lista de contadores]
 
# [https://moodle.sj.ifsc.edu.br/mod/vpl/view.php?id=3408 Filtra valores de uma lista]
 
# [https://moodle.sj.ifsc.edu.br/mod/vpl/view.php?id=2191 Palavras repetidas]
 
# [https://moodle.sj.ifsc.edu.br/mod/vpl/view.php?id=2307 Contador de palavras]
 
  
... e estes sobre ordenamento:
+
Por fim, assim como em''list'', iteradores são úteis para acessar dados e percorrer ''vector''.
# [https://moodle.sj.ifsc.edu.br/mod/vpl/view.php?id=3400 Lista ordenada de números inteiros]
 
# [https://moodle.sj.ifsc.edu.br/mod/vpl/view.php?id=3399 Ordenar linhas de um arquivo]
 
# [https://moodle.sj.ifsc.edu.br/mod/vpl/view.php?id=3406 Ordenar linhas de um arquivo de acordo com comprimentos das linhas]
 

Edição atual tal como às 14h56min de 21 de maio de 2020

[Próxima aula]



Uma lista encadeada é uma estrutura de dados em que os dados são armazenados dinamicamente em memória, de forma a se organizarem em uma sequência. Qualquer dado em uma lista pode ser acessado, independente de sua posição, assim como pode ser adicionados ou removidos de uma posição qualquer. Além disso, a ordem dos dados em uma lista pode ser modificada de diferentes maneiras (ordenamento, embaralhamento, inversão, ...). Tudo isso graças à forma com que uma lista encadeia os dados, em que cada dado armazenado possui referências tanto a seu sucessor quanto seu antecessor. Pode-se fazer um paralelo com listas reais, que aparecem em diversas situações do dia-a-dia, como estas:


Prg29003-Playlist.jpg
Uma playlist
Prg29003-Lista-tarefas.png
Uma lista de tarefas


Do ponto de vista computacional, podem-se citar estas aplicações de listas:

  • Armazenar um conjunto de dados cuja quantidade não pode ser conhecida de antemão. Exemplos são resultados de consultas a bancos de dados, listagens de arquivos de um diretório, resultados de separação de string em substrings.
  • Armazenar dados cuja ordem em memória é modificada frequentemente. Exemplos são listas de processos em execução mantidas por sistemas operacionais, listas de mensagens a serem transmitidas cuja ordem depende de suas prioridades, listas de tarefas a serem realizadas por um simulador, listas de reprodução em tocadores de músicas.

Praticamente todas as linguagens de programação usadas atualmente possuem sua própria implementação de lista. Seguem alguns exemplos:

A lista da STL

A STL apresenta a estrutura de dados list para armazenamento de sequências de dados, os quais podem ser acessados randomicamente. Em uma lista, dados podem ser adicionados e removidos de qualquer posição com eficiência, porém são acessados de forma iterativa (sempre a partir do início ou final da lista). Em list, cada dado ocupa uma área de memória sob medida, e para formar uma sequência essas áreas de memória são encadeadas (ligadas). Como consequência, os dados não ficam contíguos em memória. Por exemplo, supondo que tenha sido criada uma lista chamada numeros, e nela tenham sido adicionados os números 10, 20, 30 e 40 (nessa ordem), o armazenamento desses números em memória poderia ser este:



Prg2-Lista.png
Uma lista com alguns dados


Em geral, list é adequada quando a quantidade de dados a serem armazenados é variável e desconhecida, e quando dados precisam ser inseridos e removidos de qualquer posição. Os pontos listados a seguir buscam esclarecer melhor o que está em jogo.

  • Não é necessária uma área de memória contígua: como dados são armazenados dinamicamente, eles podem ocupar áreas de memória arbitrárias, e não há nenhuma relação entre a localização dos dados em memória e sua ordem na lista.
  • Não é possível indexar os dados, por isso para acessar um dado deve-se obrigatoriamente procurá-lo a partir do início ou fim da lista, seguindo cada sucessor ou antecessor até chegar àquele procurado.
  • Acrescentar um dado implica modificar a referência ao sucessor do dado que deve antecedê-lo na lista. Assim, não é necessário "empurrar" os dados seguintes para frente.
  • Para remover um dado é a mesma coisa: basta modificar a referência de seu antecessor. Assim, não é necessário "deslocar pra trás" os dados seguintes.


As operações elementares de list são:

  • push_back: Adicionar um dado ao final
  • push_front: Adicionar um dado no início
  • pop_front: Remover um dado do início
  • pop_back: Remover um dado do final
  • insert: Inserir um dado em uma determinada posição
  • erase: Remover um ou mais dados a partir de uma determinada posição
  • front: Acessar o dado que está no início
  • back: Acessar o dado que está no final
  • size: Obter a quantidade de dados armazenados
  • clear: Remover todos os dados (esvaziar)


Abaixo segue um exemplo de uso de algumas operações de list:

#include <cstdlib>
#include <list>
#include <iostream>
#include <string>

using namespace std;

void mostra_lista(list<string> & lista) {
    // itera a lista
    for (auto & dado: lista) {
      cout << dado << ",";
    }
    cout << endl;
}

int main(int argc, char** argv) {
    // cria uma lista de string
    list<string> nomes;
    
    // anexa três dados ao final da lista
    nomes.push_back("manuel");
    nomes.push_back("maria");
    nomes.push_back("bilica");
    
    // mostra comprimento e conteúdo da lista
    cout << "Comprimento: " << nomes.size() << ", dados: ";
    mostra_lista(nomes);

    // insere dado no início da lista
    nomes.push_front("maneca");
    cout << "Comprimento: " << nomes.size() << ", dados: ";
    mostra_lista(nomes);

    // remove dado do início da lista
    nomes.pop_front();
    cout << "Comprimento: " << nomes.size() << ", dados: ";
    mostra_lista(nomes);
    
    // ao final, lista é automaticamente destruída, e a memória utilizada
    // é liberada
    return 0;
}


Ao usar essa nova estrutura de dados, existem algumas novidades em comparação com a fila e a pilha. A primeira delas diz respeito à iteração da lista. Tanto a fila quanto a pilha possibilitavam acessar apenas os dados em suas extremidades. A lista é muito mais flexível, possibilitando acessar dados em qualquer posição. No entanto, devido à forma como os dados ficam armazenados dentro da lista, para acessá-los é necessário usar um iterador.

Iteradores

Quando se necessitam acessar em sequência todos (ou uma boa parte) dos dados de uma lista, a melhor forma é por meio da operação de iteração. A lista é capaz de ser iterada por meio de um iterador. Um iterador é um objeto que se assemelha a um ponteiro, e que possibilita acessar um dado da lista, além de avançar para o dado seguinte ou retroceder para o dado anterior. As operações begin e end da lista retornam, respectivamente, iteradores para o início ou fim da lista. O exemplo a seguir mostra como usá-los:

#include <iostream>
#include <list>

using namespace std;

int main() {
  list<int> numeros;

  numeros.push_back(34);
  numeros.push_back(7);
  numeros.push_back(21);
  numeros.push_back(8);
  numeros.push_back(12);
  numeros.push_back(17);

  // Itera do início ao fim da lista
  // A variável "it" é o iterador, que será usado para acessar os dados da lista
  // Note como ao final de cada repetição do laço o iterador é incrementado ... isso
  // faz com que se avance para o próximo dado da lista

  for (auto it = numeros.begin(); it != numeros.end(); it++) { 
    // acessa o dado atual da iteração: ele é referenciado pelo iterador,
    // como se este fosse um ponteiro

    cout << "Numero: " << *it << endl;
  }
}


Para fins de simplicidade, existe uma sintaxe na linguagem para iterar sequências de dados. Veja o exemplo anterior com essa forma de iterar:

#include <iostream>
#include <list>

using namespace std;

int main() {
  list<int> numeros;

  numeros.push_back(34);
  numeros.push_back(7);
  numeros.push_back(21);
  numeros.push_back(8);
  numeros.push_back(12);
  numeros.push_back(17);

  // Itera do início ao fim da lista
  // O iterador é usado implicitamente. Por isso, no laço a variável de controle 
  // acessa diretamente o dado atual da iteração (no caso, a variável "x").

  for (auto & x: numeros) { 
    // "x" contém o dado atual da iteração
    cout << "Numero: " << x << endl;
  }
}


Deve-se observar que isso é específico de C++: não há algo parecido na linguagem C ! Porém, essa forma simplificada de iterar sequências aparece em outras linguagens (ex: Python).

Iteração reversa

A iteração pode ser feita também em sentido contrário, se for usado um iterador reverso. Os métodos rbegin e rend de list retornam, respectivamente, iteradores reversos para o fim e início da lista:

#include <iostream>
#include <list>

using namespace std;

int main() {
  list<int> numeros;

  numeros.push_back(34);
  numeros.push_back(7);
  numeros.push_back(21);
  numeros.push_back(8);
  numeros.push_back(12);
  numeros.push_back(17);

  // Itera do início ao fim da lista
  // A variável "it" é o iterador, que será usado para acessar os dados da lista
  // Note como ao final de cada repetição do laço o iterador é incrementado ... isso
  // faz com que se retorceda para o próximo dado da lista

  for (auto it = numeros.rbegin(); it != numeros.rend(); it++) { 
    // acessa o dado atual da iteração: ele é referenciado pelo iterador,
    // como se este fosse um ponteiro

    cout << "Numero: " << *it << endl;
  }
}


A sintaxe para iteração simplificada não se aplica à iteração reversa !

Atividade

Objetivo: escrever um programa que mescle as informações contidas em diferentes arquivos, eliminando informações repetidas

  • Descrição: existe um conjunto de arquivos, os quais contêm dados sobre alunos de uma escola. Cada arquivo corresponde a uma disciplina de algum curso dessa escola. Cada linha desses arquivos tem este formato:
matrícula aluno

... sendo matrícula um número com 8 dígitos, e aluno o nome completo de um aluno.

Há a necessidade de obter uma relação dos alunos matriculados nessas disciplinas, sendo que cada aluno deve aparecer uma única vez.


Para se familiarizar com o uso de listas, resolva primeiro estes exercícios:

  1. Lista de números inteiros
  2. Copiar uma lista usando iteração
  3. Junta strings contidas em uma lista
  4. Filtra valores de uma lista
  5. Lista de contadores
  6. Palavras repetidas
  7. Contador de palavras
  8. A função separa usando lista
  9. Compactador de endereço IPv6

Um resumo sobre a notação para complexidade de algoritmos

Prg2-Big-o-table.jpg
Figura obtida deste artigo sobre estruturas de dados em Python

Operações que reorganizam a lista

Três operações disponíveis na lista reorganizam a ordem dados dados armazenados:

  • ordenamento: ordena os dados de forma eficiente
  • embaralhamento: mistura os dados aleatoriamente
  • inversão: inverte a ordem dos dados

Ordenamento da lista

A lista possui o método sort, que ordena seus dados. O ordenamento é feito por um algoritmo com razoável eficiência (ele tem custo de tempo computacional O(n log n)), e isso é importante porque esse tipo de operação tem custo computacional considerável (pode ser proporcional ao quadrado da quantidade de dados se não for bem feito). O único requisito para ordenar uma lista é que os dados armazenados possuam uma relação de precedência. Em outras palavras, que possam ser comparados com operador < (menor que). O exemplo a seguir mostra o ordenamento de uma lista:

#include <iostream>
#include <list>

using namespace std;

int main() {
  list<int> numeros;

  numeros.push_back(34);
  numeros.push_back(7);
  numeros.push_back(21);
  numeros.push_back(8);
  numeros.push_back(12);
  numeros.push_back(17);

  // ordena a lista
  numeros.sort();

  // mostra o conteúdo da lista
  for (auto & x: numeros) {
    cout << x << endl;
  }

  cout << endl;
}

Como o método sort depende da existência do operador < para o tipo dos dados armazenados, as mesmas considerações feitas quanto à operação de igualdade se aplicam aqui. A próxima subseção mostra um exemplo de ordenamento de uma lista que contém valores de um tipo definido pelo programador.

Ordenamento de uma lista com valores de um tipo definido pelo programador

A operação sort depende da comparação de precedência dos dados contidos numa lista. Isso pode ser feito usando o operador < para o tipo desses dados (caso exista), ou uma função de comparação específica para essa finalidade. O operador < existe na linguagem para tipos básicos, tais como int, float, char e outros. Mas o mesmo não vale para tipos de dados definidos pelo programador, ou mesmo classes. Nesse caso, o programador deve definir o operador < , pois somente ele sabe como valores desses tipos devem ser comparados. Observe-se também que a comparação dos dados não é um problema da lista, que apenas usa a comparação. Em suma, cada tipo e dados ou classe deve saber como comparar seus valores ou objetos, ou deve existir uma função para fazer essa comparação.

O caso mais simples envolve escrever uma função que compare valores do tipo de dados em questão. O exemplo a seguir mostra como essa função deve ser declarada, e depois como ela pode ser utilizada para fazer o ordenamento.

// compara duas strings de acordo com seus comprimentos
bool comp_comprimento(cons string & s1, const string & s2) {
  return s1.size() < s2.size();
}

int main() {
  list<string> l;

  l.push_back("banana");
  l.push_back("caju");
  l.push_back("laranja");
  l.push_back("cajamanga");

  // ordena lista de string de acordo com comprimentos das string
  l.sort(comp_comprimento);

  // mostra conteúdo da lista na tela
  for (auto & w: l) {
    cout << w << endl;
  }
}


A linguagem C++ possibilita definir como um determinado operador deve funcionar. Isso aplicado ao operador < resolve o problema da comparação de um tipo de dados definido pelo programador. A implementação de um operador pode ser feita de duas maneiras:

  1. Incluindo-o ao tipo struct ou à classe:
    struct Registro {
      // atributos do tipo Registro
    
      bool operator<(const Registro & outro) const;
    };
    
  2. Criando uma função:
    // compara "este" com "outro"
    bool operator<(const Registro & este, const Registro & outro) const {
      // implementação da comparação: verifica se "este" < "outro"
    }
    


Ambas as formas de implementar um operador são válidas e resolvem o problema. Uma observação diz respeito à implementação com uma função, a qual tem precedência sobre a implementação dentro da struct ou classe. Isso significa que mesmo que já exista o operador em questão definido dentro de uma struct ou classe, ele pode ser substituído por outra implementação desse operador em uma função. A isso se chama sobrecarga de operador.


O exemplo a seguir mostra um programa que cria uma lista com valores de um novo tipo de dados, e a ordena.

Exemplo com o operador< como um método do novo tipo de dados
#include <iostream>
#include <string>
#include <list>
 
using namespace std;

// Tipo Alguem: representa uma pessoa com seu nome e idade 
struct Alguem {
    string nome;
    int idade;
    
    Alguem() {
        idade = 0;        
    }
    
    Alguem(const string & umNome, int age) {
        nome = umNome;
        idade = age;
    }
    
    // sobrecarga do operador< para o tipo Alguem
    bool operator<(const Alguem & o) {
        if (idade == o.idade) {
            return nome < o.nome;
        }
        return idade < o.idade;
    }
    
};

int main() {
  list<Alguem> l;
  
  Alguem joao("Joao", 20);
  l.push_back(joao);
  
  Alguem x1("Amanda", 15);
  l.push_back(x1);
  
  Alguem x2("Gabriel", 19);
  l.push_back(x2);
  
  l.push_back(Alguem("Isadora", 18));
  l.push_back(Alguem("Gustavo", 18));
  
  // ordena a lista
  l.sort();
 
  // mostra a lista ...
  for (auto & pessoa: l) {
    cout << pessoa.nome << ": " << pessoa.idade << endl;
  }
  
  cout << endl;
}
Exemplo do operador< como uma função
#include <iostream>
#include <string>
#include <list>
 
using namespace std;

// Tipo Alguem: representa uma pessoa com seu nome e idade 
struct Alguem {
    string nome;
    int idade;
    
    Alguem() {
        idade = 0;        
    }
    
    Alguem(const string & umNome, int age) {
        nome = umNome;
        idade = age;
    }        
};

// sobrecarga do operador< para o tipo Alguem
bool operator<(const Alguem & este, const Alguem & outro) {
    if (este.idade == outro.idade) {
        return este.nome < outro.nome;
    }
    return este.idade < outro.idade;
}


int main() {
  list<Alguem> l;
  
  Alguem joao("Joao", 20);
  l.push_back(joao);
  
  Alguem x1("Amanda", 15);
  l.push_back(x1);
  
  Alguem x2("Gabriel", 19);
  l.push_back(x2);
  
  l.push_back(Alguem("Isadora", 18));
  l.push_back(Alguem("Gustavo", 18));
  
  // ordena a lista
  l.sort();
 
  // mostra a lista ...
  for (auto & pessoa: l) {
    cout << pessoa.nome << ": " << pessoa.idade << endl;
  }
  
  cout << endl;
}


Inversão

A inversão da lista, implementada pela operação reverse, envolve inverter a ordem dos dados nela armazenados: o primeiro se torna o último, o segundo o penúltimo, e assim por diante. O algoritmo envolvido tem custo de tempo computacional O(n).

Seu uso é direto, e não há dependência a qualquer operador do tipo dos dados armazenados. Um exemplo de uso é este:

#include <iostream>
#include <list>

using namespace std;

int main() {
  list<int> numeros;

  numeros.push_back(34);
  numeros.push_back(7);
  numeros.push_back(21);
  numeros.push_back(8);
  numeros.push_back(12);
  numeros.push_back(17);

  // ordena a lista
  numeros.sort();

  // ... e agora a inverte, para obter um ordenamento decrescente
  numeros.reverse();

  // apresenta a lista
  for (auto & x: numeros) {
    cout << x << endl;
  }

}

Atividade

Faça estes exercícios que envolvem ordenamento:

  1. Lista ordenada de números inteiros
  2. Ordenar linhas de um arquivo
  3. Ordenar linhas de um arquivo de acordo com comprimentos das linhas


Curiosidade: contando quantas vezes cada valor existe em uma lista

Em um projeto sobre estatísticas sobre filmes e atores, ralizado em 2019.2, o requisito "listar os atores que mais atuaram, por ordem decrescente de atuações em filmes" poderia ser resolvido de mais de uma maneira. Uma abordagem é criar uma lista contendo todos os nomes de atores que atuaram nos filmes, de forma que, se um ator trabalhou em três filmes, seu nome apareceria três vezes nessa lista. Basicamente isso implica listar os atores de cada filme, e acrescentá-los a essa nova lista. Ao final, bastaria contar quantas vezes cada ator aparece na lista.

Ao menos dois algoritmos podem ser pensados para esse problema:

  1. Para cada ator da lista, iterar a lista para contar quantas vezes seu nome aparece. Há que cuidar para realizar essa procura somente para a primeira vez em que cada ator é avaliado.
  2. Ordenar a lista de atores, e então iterá-la. Os nomes de atores ficarão contíguos, o que facilita contá-los. Se o próximo ator da iteração for diferente do anterior, então registra-se a contagem do ator anterior e reinicia-se o contador.


Qual dos dois algoritmos é melhor, do ponto de vista de custo computacional (tempo para que concluam) ? O gráfico abaixo responde essa questão !

PRG2-Conta repetidos.png
Custo computacional dos algoritmos para contar valores repetidos em uma lista, para listas de números inteiros

Uma alternativa à lista: vetor dinâmico

A STL apresenta uma outra estrutura de dados linear chamada vector. Essa estrutura se apŕesenta como um vetor dinâmico, em que dados são armazenados de forma parecida com um vetor, porém cuja área de armazenamento em memória pode ser expandida automaticamente. Em vector, os dados estão sempre contíguos em memória. Um vector usa uma área de memória capaz de guardar a quantidade de dados armazenados, estando os dados gravados sequencialmente ali dentro. A figura a seguir mostra como um vector usa memória para armazenar dados.

Prg2-Vector.png
Um vector com alguns dados armazenados


Em geral, vector é adequado quando os dados são armazenados e removidos do final da área de armazenamento, e também quando se precisam acessá-los diretamente (por suas posições) e/ou aleatoriamente. Com list é o contrário, pois ela é adequada quando dados precisam ser inseridos e removidos de qualquer posição. Cabe ao programador escolher a estrutura mais adequada em cada situação. Os pontos listados a seguir buscam esclarecer melhor o que está em jogo.

  • Com list, não é necessária uma área de memória contígua: como dados são armazenados dinamicamente, eles podem ocupar áreas de memória arbitrárias, e não há nenhuma relação entre a localização dos dados em memória e sua ordem na lista. No caso de vector, a localização dos dados em memória está diretamente ligada a suas posições na área de armazenamento.
  • Com list não é possível indexar os dados, por isso para acessar um dado deve-se obrigatoriamente procurá-lo a partir do início ou fim da lista, seguindo cada sucessor ou antecessor até chegar àquele procurado.
  • Com vector podem-se indexar os dados, acessando-os diretamente por suas posições, uma vez que suas localizações em memória podem ser calculadas em função de suas posições.
  • Com list, acrescentar uma dado implica modificar a referência ao sucessor do dado que deve antecedê-lo na lista. Assim, não é necessário "empurrar" os dados seguintes para frente (como seria o caso quando se usa vector).
  • Para remover um dado é a mesma coisa: basta modificar a referência de seu antecessor. Assim, não é necessário "deslocar pra trás" os dados seguintes (como seria o caso de vector).


As operações que podem ser feitas em vector são parecidas com as operações de list.

  • push_back: Adicionar um dado ao final
  • insert: Inserir um dado em uma determinada posição
  • erase: Remover um ou mais dados a partir de uma determinada posição
  • front: Acessar o dado que está no início
  • operador []: Acessar um dado em uma posição qualquer
  • back: Acessar o dado que está no final
  • size: Obter a quantidade de dados armazenados
  • clear: Remover todos os dados (esvaziar)


Abaixo segue um exemplo de uso de algumas operações de vector:

#include <cstdlib>
#include <vector>
#include <iostream>
#include <string>

using namespace std;

void mostra_vetor(vector<string> & v) {
    // itera o vetor
    for (auto & dado: v) {
      cout << dado << ",";
    }
    cout << endl;
}

int main(int argc, char** argv) {
    // cria um vector de string
    vector<string> nomes;
    
    // anexa três dados ao final do vector
    nomes.push_back("manuel");
    nomes.push_back("maria");
    nomes.push_back("bilica");
    
    // mostra comprimento e conteúdo do vector
    cout << "Comprimento: " << nomes.size() << ", dados: ";
    mostra_vetor(nomes);

    // Acessa um dado por sua posição
    for (int i=0; i < v.size(); i++) {
      cout << "Dado na posição " << i << ": " << nomes[i] << endl;
    }

    // remove dado do final do vector
    nomes.pop_back();
    cout << "Comprimento: " << nomes.size() << ", dados: ";
    mostra_vetor(nomes);
    
    // ao final, vector é automaticamente destruído, e a memória utilizada
    // é liberada
    return 0;
}


Nem tudo que se pode fazer com list está disponível em vector:

  • Ordenamento: não há uma operação de ordenamento para vector, porém é possível ordená-los por meio de um algoritmo existente na STL.
  • Embaralhamento: não existe uma operação para embaralhar os dados em um vector, mas também há um algoritmo para essa finalidade na STL.
  • Reversão: não há operação para inverter as ordens dos dados, o que também depende de um algoritmo da STL.
  • ... e algumas outras operações de list !


Por fim, assim como emlist, iteradores são úteis para acessar dados e percorrer vector.