quarta-feira, janeiro 10, 2024
  • Login
Linux Descomplicado
Advertisement
No Result
View All Result
No Result
View All Result
Linux Descomplicado
No Result
View All Result
Home Comandos Linux

Algumas ferramentas de linha de comando Linux indicadas para análise de dados em um arquivo

11 de abril de 2017
Reading Time: 6 mins read
0
Algumas ferramentas de linha de comando Linux indicadas para análise de dados em um arquivo
145
SHARES
2.1k
VIEWS
Compartilhar no FacebookCompartilhar no Twitter

Uma análise de dados requer ferramentas bem específicas para obter o maior número de informações sobre determinado conteúdo. Pode ser uma simples arquivo de planilha ou uma base de dados robusta. Em algumas situações, basta você usar algumas ferramentas, que já vêm instaladas no Linux, para obter informações relevantes sobre alguns dados. A maioria delas presente no pacote GNU Coreutils.

Uma análise de dados consiste em manipular um conjunto de dados com o objetivo de obter informações precisas e relevantes desse conjunto. Em resumo, é capturar uma base de dados de informações “bruta” e obter detalhes, mediante critérios adotados. Entretanto, numa análise de dados possui diferentes abordagens, incorporando diversas técnicas. O exemplo adotado aqui será bem simples, cabe a você definir os critérios a serem analisados 😉

man-data-analytics-chalkboard-ss-1920

Faça o download de uma arquivo de dados de amostra, contidos no GitHub, que é uma lista de artigos CSV (valores separados por vírgula) publicado no Opensource.com.

Análise de dados no Linux

AVISO
Esse material foi baseado no artigo original do Opensource.com. Portanto, é importante que faça o download do arquivo de amostra AQUI. Esse arquivo será utilizado para realizarmos a análise dos dados!

1 – Head e Tail

Um simples comando cat pode exibir todo o conteúdo do arquivo CSV. Contudo, a análise de dados pode ficar dificultada por conta da quantidade de linhas existentes no arquivo. Com os comandos head e tail – ambos utilitários para mostrar um número especificado de linhas da parte superior ou inferior do arquivo, respectivamente – torna a visualização dos dados mais fácil:

tail -n 3 arquivo.csv

Onde,

-n: indica o número de linhas a serem exibidas. No caso as últimas 3 linhas.

O comando tail exibe as últimas linhas de um arquivo. Por outro lado, é importante visualizar o conteúdo do início do arquivo. Para “filtrar” o cabeçalho do arquivo, use o comando head:

head -n 2 arquivo.csv

Onde,

-n: indica o número de linhas a serem exibidas. No caso as primeiras 2 linhas.

Assim, dado um arquivo, no qual ainda não é conhecido por você, “começar” usando os comandos head e tail aumenta o compreendimento do que ele refere-se 😉

2 – wc

Mas, quão grande é esse arquivo? O comando wc pode ajudar. Ele conta o número de bytes, caracteres, palavras ou linhas de um arquivo. No nosso caso, queremos saber o número de linhas:

wc -l arquivo.csv

Onde,

-l: indica que deve ser feita contagem de linhas.

3 – grep

Mediante a seus critérios, você pode querer saber quantas vezes determinada palavra se repete; por exemplo. A ferramenta grep pode ajudar com nisso. Com o grep, você pode pesquisar, num arquivo ou numa outra entrada, um determinado padrão de caracteres – no caso uma palavra.

O grep é uma ferramenta incrivelmente poderosa. Tudo graças às expressões regulares que você pode construir para criar padrões de caracteres muito precisos. Entretanto, nesse exemplo apenas procuraremos uma sequência simples:

grep -i “security” arquivo.csv

Onde,

-i: avisa para NÃO diferenciar maiúsculas e minúsculas.

O resultado pode ser muito grande e, provavelmente, “incontável” a olho nu. Assim, usando um “pipe”, podemos combinar o grep com o comando wc, usado anteriormente, para obter uma contagem do total de linhas que contém a palavra “security”:

grep -i “security” arquivo.csv | wc -l

Neste caso, o wc “pegou” a saída do comando grep, e usou-o como entrada, sem precisar executar um comando para depois o outro – “mágica” do pipe (|) 😉

RECOMENDO QUE LEIA
Algumas ferramentas de terminal que podem ser mais práticas do que os aplicativos gráficos
GoTTY – Compartilhe suas ferramentas de terminal Linux como uma aplicação web

4 – tr

Um arquivo CSV é um formato bastante útil para muitos cenários de análise, mas e se você precisar converter o arquivo para um formato diferente para uso em um aplicativo diferente?

Talvez, você deseja alterá-los para algum HTML para que você possa usar a saída de dados em uma tabela. O comando tr pode ajudá-lo com isso, para “traduzir” um tipo de caracter para outro. Como os outros exemplos, você também pode canalizar entrada e saída para este comando.

Assim, vamos criar um arquivo TSV (arquivo separado por espaçamento TAB) com apenas os artigos publicados em 20 de janeiro (informação contida no arquivo.csv):

grep “20 Jan 2017” arquivo.csv | tr ‘,’ ‘\t’ > jan20-somente.tsv

Observe que foi criado um novo arquivo (jan20-somente.tsv) contendo somente as linhas que contêm as postagens do dia 20 janeiro. Tudo isso usando o grep, o pipe (|) e comando tr. O tr converteu o separador ‘,’ para o ‘\t’ (TAB) e caracter ‘>’ redirecionou a saída para o novo arquivo 😉

Para visualizar o conteúdo do novo arquivo, execute:

cat jan20-somente.tsv

5 – sort

E se quiséssemos saber mais detalhes sobre uma determinada coluna? Qual é a maior postagem publicada no dia 20 janeiro? Agora que temos uma lista de artigos de apenas a data 20 de janeiro, podemos usar o comando sort para ordenar uma coluna:

sort -nr -t$’\t’ -k8 jan20-somente.tsv | head -n 1

Primeiro, está sendo usado o comando sort para ordenar pelo número de palavras. A opção -nr solicita uma ordenação numérica e em ordem inversa (maior para menor). O -t $’\t’ informa que o delimitador é a guia (‘\t’ – TAB). O -k8 do comando sort diz que é para ordenar usando como base a 8a coluna do arquivo (Word count) – possui a contagem de palavras no arquivo tsv.

Por fim, logo após o pipe (|) é usado o comando head para exibir a primeira linha(-n), depois da ordenação.

6 – cut

E se precisar das informações de apenas uma coluna? Vamos criar uma nova lista de “autores” usando o comando cut:

$ cut -d’,’ -f3 arquivo.csv > autores.txt

Neste exemplo simples, usando o cut com -d ‘,’ informa que o arquivo é delimitado por vírgula. Além disso, com o -f3 é solicitada a terceira coluna. Por fim, é enviado a saída para um novo arquivo chamado autores.txt 😉

7 – unique

Com uma lista de autores, você pode precisar saber quantos autores únicos estão nela. Ou quantos artigos escreveu cada autor? Use o comando uniq. Com o uniq, você pode facilmente descobrir. Vamos ordenar o arquivo, encontrar uniques, em seguida, saídas um arquivo que tem uma contagem do número de artigos escritos por cada autor.

sort autores.txt | uniq -c > autores-ordenados.txt

Onde,

-c: solicita que seja mostrado o número de ocorrências de cada item (no caso, autor).

Considerações

Pode ser que não seja tão útil, num primeiro momento, usar o terminal para realizar esse tipo de análise. Mas, imagine um arquivo com grande volume de dados, com mais 50 mil linhas, por exemplo. Um software gráfico, provavelmente, irá “travar” ao tentar abrir um arquivo tão grande. Por isso, talvez não seja a melhor opção usar um software gráfico para ambientes assim :/

RECOMENDO QUE LEIA
Saiba como manipular documentos usando a interface de linha de comando do LibreOffice
Alguns exemplos de que o comando dd pode ser considerado umas das ferramentas mais versáteis do Linux

Assim, ao mostrar essas ferramentas de linha de comando, e, talvez, usando um script, você pode trabalhar com grandes quantidades de dados com mais facilidade. Por isso, é recomendado aprender estas e outras ferramentas (como sed e awk não citadas no artigo) de análise de dados de linha de comando 😉

Por fim, como o que foi apresentado foi apenas uma introdução, solicito que consulte o manual de comandos de cada ferramenta no seu sistema Linux para mais recursos e funções!


Via | Opensource.com

Gosta de Linux?! Receba materiais exclusivos!

Inscreva-se gratuitamente e receba, com exclusividade, postagens e materiais ocultos para o público em geral. Inclusive, promoções e novidades em primeira mão!

Entrar na lista de e-mails

Related Posts

5 Razões pelas quais o Linux Mint é a Distribuição perfeita para usuários vindos do Windows
Distribuições

5 Razões pelas quais o Linux Mint é a Distribuição perfeita para usuários vindos do Windows

4 de dezembro de 2023
Linux ou Windows: Guia completo para você fazer a escolha certa
Dicas

Linux ou Windows: Guia completo para você fazer a escolha certa

3 de dezembro de 2023
Noticias

A Emoção dos Bônus de Sorteio Semanal no BC Games: Como Aumentar Suas Chances de Vitória

7 de novembro de 2023
Jogos no Metaverso: Explorando a próxima fronteira dos mundos virtuais
Noticias

Jogos no Metaverso: Explorando a próxima fronteira dos mundos virtuais

30 de agosto de 2023
SaaS, IaaS, PaaS e FaaS: tipos de serviços em nuvem, suas vantagens e aplicações
Administradores de Rede

SaaS, IaaS, PaaS e FaaS: tipos de serviços em nuvem, suas vantagens e aplicações

2 de agosto de 2023
Criação de Apps: do Desenvolvimento à Publicação
Tecnologia

Criação de Apps: do Desenvolvimento à Publicação

31 de maio de 2023

Últimas novidades

A Emoção dos Bônus de Sorteio Semanal no BC Games: Como Aumentar Suas Chances de Vitória

by Linux Descomplicado
7 de novembro de 2023
0

O mundo dos jogos online é vasto e repleto de oportunidades para diversão e, às vezes, recompensas financeiras. Entre esses...

Jogos no Metaverso: Explorando a próxima fronteira dos mundos virtuais

Jogos no Metaverso: Explorando a próxima fronteira dos mundos virtuais

by Linux Descomplicado
30 de agosto de 2023
0

Nos últimos anos, o mundo dos jogos vem passando por uma revolução que está redefinindo a forma como entendemos os...

Saiba como acompanhar os jogos da Copa do Mundo no Linux

Saiba como acompanhar os jogos da Copa do Mundo no Linux

by Linux Descomplicado
14 de outubro de 2022
0

Conheça algumas estratégias adotadas por quem deseja acompanhar os jogos da Copa do Mundo 2022 usando o Linux

Como aproveitar o uso de proxy móvel no seu negócio?

Como aproveitar o uso de proxy móvel no seu negócio?

by Linux Descomplicado
31 de agosto de 2022
0

Dados são a nova moeda do mercado, e quanto mais uma empresa conhece as necessidades e desejo dos usuários, mais...

Metaverso: o que precisamos entender sobre esse conceito

Metaverso: o que precisamos entender sobre esse conceito

by Linux Descomplicado
23 de maio de 2022
0

Se um dia alguém dissesse ser possível combinar realidade virtual imersiva, MMORPG e web, isso seria chamado insanidade. No entanto,...

Load More

Publicaçõesmais recentes

5 Razões pelas quais o Linux Mint é a Distribuição perfeita para usuários vindos do Windows
Distribuições

5 Razões pelas quais o Linux Mint é a Distribuição perfeita para usuários vindos do Windows

by Linux Descomplicado
4 de dezembro de 2023
0

Existem muitas versões do Linux que são boas para iniciantes, mas o Linux Mint é especialmente voltado para pessoas que...

Read more
Linux ou Windows: Guia completo para você fazer a escolha certa
Dicas

Linux ou Windows: Guia completo para você fazer a escolha certa

by Linux Descomplicado
3 de dezembro de 2023
0

Escolher entre Linux e Windows é uma decisão crucial que afeta diretamente a experiência do usuário no mundo da tecnologia....

Read more
Noticias

A Emoção dos Bônus de Sorteio Semanal no BC Games: Como Aumentar Suas Chances de Vitória

by Linux Descomplicado
7 de novembro de 2023
0

O mundo dos jogos online é vasto e repleto de oportunidades para diversão e, às vezes, recompensas financeiras. Entre esses...

Read more
Jogos no Metaverso: Explorando a próxima fronteira dos mundos virtuais
Noticias

Jogos no Metaverso: Explorando a próxima fronteira dos mundos virtuais

by Linux Descomplicado
30 de agosto de 2023
0

Nos últimos anos, o mundo dos jogos vem passando por uma revolução que está redefinindo a forma como entendemos os...

Read more
SaaS, IaaS, PaaS e FaaS: tipos de serviços em nuvem, suas vantagens e aplicações
Administradores de Rede

SaaS, IaaS, PaaS e FaaS: tipos de serviços em nuvem, suas vantagens e aplicações

by Linux Descomplicado
2 de agosto de 2023
0

Os serviços em nuvem trazem muitas vantagens para qualquer pessoa ou empresa que utilize arquivos digitais. Mas você sabe a...

Read more
Criação de Apps: do Desenvolvimento à Publicação
Tecnologia

Criação de Apps: do Desenvolvimento à Publicação

by Linux Descomplicado
31 de maio de 2023
0

Até 2022, a Google Play Store somava mais de 3,3 milhões de aplicativos móveis disponíveis para download. Já na Apple...

Read more
Load More

Mantenha-se conectado

  • Área Exclusiva 200 Membros
  • 23k Fãs
  • 8k Seguidores
  • 500 Leitores
  • 100 Seguidores
  • 1k Inscritos
  • 2k Leitores

Quer receber as novidades mais recentes no seu e-mail? Informe-o no campo de e-mail e clique em Assinar! Mais de 2000 já se inscreveram

*Sem spam, eu prometo :).

ATENÇÃO
Os comentários abaixo são de inteira responsabilidade de seus respectivos autores e não representam, necessariamente, a opinião do Linux Descomplicado.

Deixe uma resposta Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Next Post
5 acontecimentos importantes depois do anúncio da Canonical sobre o Unity e Ubuntu Phone

5 acontecimentos importantes depois do anúncio da Canonical sobre o Unity e Ubuntu Phone

O Linux Descomplicado nasceu, em 2011, com o intuito de trazer informações relevantes e promover fácil acesso a todos usuários interessados em aprender a usar o sistema Linux, independentemente se está iniciando ou tem certa experiência com Linux.

Participe

  • Publique seu artigo
  • Login como articulista
  • Pesquisa – sobre os leitores

Editorial

  • Contato
  • Anuncie aqui
  • Política de privacidade

Newsletter

Quer receber as novidades mais recentes no seu e-mail? Informe-o no campo de e-mail e clique em Assinar! Mais de 2000 já se inscreveram

*Sem spam, eu prometo :).

Promoções e materiais exclusivos!

Cadastre-se gratuitamente
  • #9720 (sem título)
  • Anuncie aqui
  • Contato
  • Excluir conta
  • Home
  • Login Customizer
  • Newsletter
  • Newsletter personalizada
  • Pesquisa – sobre os leitores
  • Política de privacidade
  • Promoções e novidades
  • Publicações especias
  • Publicações favoritas
  • Publique seu artigo
  • Saiba como você pode contribuir
  • Sobre
  • Termos de uso

© 2024 JNews - Premium WordPress news & magazine theme by Jegtheme.

No Result
View All Result
  • #9720 (sem título)
  • Anuncie aqui
  • Contato
  • Excluir conta
  • Home
  • Login Customizer
  • Newsletter
  • Newsletter personalizada
  • Pesquisa – sobre os leitores
  • Política de privacidade
  • Promoções e novidades
  • Publicações especias
  • Publicações favoritas
  • Publique seu artigo
  • Saiba como você pode contribuir
  • Sobre
  • Termos de uso

© 2024 JNews - Premium WordPress news & magazine theme by Jegtheme.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In