Article image
Carlos CGS
Carlos CGS15/09/2025 07:46
Compartilhe

Como Controlar seu PC por voz com Python + OS, para abrir Apps com o J.A.R.V.I.S.

    🌌 Projeto CodeVerse Python – #37/2025

    👋 Fala, galera dev! 🚀

    Já estamos no artigo 37 do ProjetoCodeVersePython2025, onde terão 52 artigos publicados todas as segundas feiras ás 07:00h, e hoje vamos explorar uma funcionalidade que vai deixar nosso Jarvis ainda mais útil: fazer ele abrir programas do Windows através de comandos de voz. Isso mesmo. Vamso falar com nosso assistente e ele abirá calculadora, excel, word, paint e muito mais, tudo através de comandos de voz! Então fique até o final que iremos aprender o passo a passo de como usar essa funcionalidade simples, mas que ao mesmo tempo dá um ar de super aplicação ao nosso J.A.R.V.I.S.

    🧠 O que são bibliotecas nativas em Python?

    Antes de irmos direto para o código, vamos entender o conceito. Python vem com um conjunto de bibliotecas nativas, ou seja, pacotes que já estão prontos para uso sem precisar instalar nada extra. Elas servem para facilitar nossa vida em tarefas comuns, como manipular arquivos, acessar o sistema operacional, trabalhar com datas e muito mais.

    Uma dessas bibliotecas é a os, que nos permite interagir diretamente com o sistema operacional, de forma simples e rápida.

    • Pense na biblioteca os como a armadura do Homem de Ferro. O Tony Stark sozinho já é inteligente, mas com a armadura ele consegue controlar sistemas, abrir portas, lançar mísseis e se conectar a tudo ao redor.
    • O OS é isso para o Python: dá ao nosso código o poder de controlar funções do sistema operacional diretamente a etravés de nosso código!

    🐍 Parte 1 – Usando a biblioteca os isoladamente

    Vamos começar pequeno: abrir aplicativos do Windows usando apenas Python e a biblioteca os. Ela é bem simples, e como mencionado acima, ela é nativa do python, com isso só precisamos fazer sua importação e a usar em nossa aplicação como mostrado no c´dogio abaixo.

    Nele eu preferi ser bem simplista e mostrar apenas como essa biblioteca é usada para fins de apredizado menos poluído quando adicionamos o uso dessa juntos das outras funcionalidades da nossa aplicação, aquelas que já aprendemos em artigos anterios, como conexão com API de IA, reconhecimento de voz, etc.

    import os
    
    # Abrindo programas do Windows
    os.system("start calc.exe")      # Abre a calculadora
    os.system("start notepad.exe")   # Abre o bloco de notas
    os.system("start mspaint.exe")   # Abre o Paint
    os.system("start winword.exe")   # Abre o Word
    os.system("start excel.exe")     # Abre o Excel
    os.system("start chrome.exe")    # Abre o Google Chrome
    

    Como isso funciona?

    • import os → chamamos a biblioteca nativa.
    • os.system("start ...") → enviamos um comando direto para o Windows como se fosse digitado no Prompt de Comando (cmd).
    • O nome após o start é o executável do programa.

    Simples assim: com poucas linhas, já conseguimos controlar o Windows!

    image

    🤖 Parte 2 – Usando no Jarvis

    Agora vamos integrar isso ao nosso projeto Jarvis. A ideia é simples: quando dissermos um comando de voz, o Jarvis entende, abre o aplicativo e ainda responde que está abrindo.

    import speech_recognition as sr
    import pyttsx3
    import os
    
    # Inicializa voz
    engine = pyttsx3.init()
    def falar(texto):
      engine.say(texto)
      engine.runAndWait()
    
    # Inicializa reconhecimento
    r = sr.Recognizer()
    
    with sr.Microphone() as source:
      print("Jarvis está ouvindo... 🎤")
      r.adjust_for_ambient_noise(source, duration=0.8)
      audio = r.listen(source, timeout=5)
    
    try:
      comando = r.recognize_google(audio, language="pt-BR").lower()
      print("Você disse:", comando)
    
      if "abrir calculadora" in comando:
          falar("Abrindo a calculadora, senhor.")
          os.system("start calc.exe")
    
      elif "abrir word" in comando:
          falar("Abrindo o Word, senhor.")
          os.system("start winword.exe")
    
      elif "abrir excel" in comando:
          falar("Abrindo o Excel, senhor.")
          os.system("start excel.exe")
    
      elif "abrir paint" in comando:
          falar("Abrindo o Paint, senhor.")
          os.system("start mspaint.exe")
    
      elif "abrir navegador" in comando:
          falar("Abrindo o navegador, senhor.")
          os.system("start chrome.exe")
    
      else:
          falar("Infelizmente ainda não sei abrir esse programa, senhor.")
    
    except sr.UnknownValueError:
      falar("Não entendi o que foi dito, senhor.")
    except sr.RequestError:
      falar("Erro de conexão com o serviço de reconhecimento, senhor.")
    

    Nesse exemplo que escrevi, é bem simples como interagimos com nossa aplicação: ao iniciar, ela fica nos ouvindo e, quando dissermos algum comando que foi previamente definido e armazenado na variável comando, alguns exemplos de falas válidas são:

    • "abrir paint"
    • "abrir calculadora"
    • "abrir word"

    Depois de armazenar o que dissemos na variável comando, comparamos através da estrutura de decisão if, elif, else se o que foi dito é igual a um dos termos pré-definidos anteriormente. Caso um desses seja igual, nosso Jarvis diz que está abrindo a aplicação selecionada e, logo após, usa a biblioteca os.system para executar o programa solicitado. Tudo isso em poucos segundos.

    🔮 Concluindo...

    Com essa nova funcionalidade, nosso Jarvis ficou ainda mais poderoso! Agora, além de entender e responder com voz, ele também pode abrir aplicativos do Windows por comando de voz.

    Estamos tornando o projeto cada vez mais robusto e completo, adicionando funcionalidades que o aproximam de um verdadeiro assistente pessoal. Cada biblioteca que aprendemos a usar é como mais uma peça da armadura do Tony Stark: juntas, elas transformam o Jarvis em algo realmente incrível.

    Esse artigo foi bem curto e simples, mas é indispensável, pois é através desta biblioteca que automatizamos diversas funções da nossa aplicação, permitindo que com comandos por voz, consigamos abrir aplicativos em nosso windows. Igual como é feito com a alexa, e siri.

    👉 E aí, curtiu? Me siga no GitHub e no LinkedIn para acompanhar cada passo do Projeto CodeVersePython2025.

    Porque o futuro não é esperar a tecnologia chegar. É a gente criar ele hoje. ⚡

    image

    Compartilhe
    Comentários (0)