Переведите голосовое сообщение в текст

Приложение @speech_into_text переведет аудиосообщение в текст. Приложение также найдёт и исправит ошибки, а также отформатирует текст в различные стили, будь то научная статья, электронное письмо, бизнес-план или словарь.

Я использую @speech_into_text для написания статей, создания подсказок для chatGPT, отправки сообщений друзьям и формулирования идей.

Платите 100 рублей за час аудио, то есть 1.67 рубля в минуту. Деньги пойдут на обслуживание сервера и использование API. Если вам приложение приглянулось, поделитесь своим опытом и порекомендуйте его друзьям и коллегам. Если знаете, как улучшить приложение, раскрутить его, буду рад услышать предложения.

Финансовый словарь в телеграмме

Изучите финансовые термины на английском на канале Financial Terms в Телеграмме. Каждый день новое слово и определение. Иногда будут книжки по финансам.

Я создал бота, который придумывает слово и описание к нему, рисует картинку и отправляет сообщение каждый день в телеграмм. Используйте код в своих проектах, при условии, что Koveh.com будет указан в контрибьютерах проекта, а так же уведомите меня об использовании кода.

Исходный код

Кроме определений, я выкладываю книги по финансам, которые дали мне обширные знания в легкой форме. Одна из них уже опубликована в Financial Terms.

Код: Автоматические поздравления на день рождения в Телеграм

Запишите имя и день рождения в базу данных и другу придет сообщение с вашего аккаунта. Можете заготовить поздравления заранее или использовать стандартное поздравление на русском или английском.

Скачать код с гитхаба

Подключить код к серверу

Я использую сервер на операционной системе Linux Ubuntu и использую стандартную командную строку.
Бесплатные серверы:

  • Oracle — навсегда бесплатно, дают 250$ на сервисы.
  • Google — навсегда бесплатно, дают 300$ на сервисы.
  • Amazon — Всегда бесплано, серверы посильнее — 12 месяцев бесплатно.
  • DigitalOcean — для студентов год использования бесплатно, дают 200$ на сервер.

Достаточно сервера с 1 CPU и 256мб оперативной памяти. Создайте сервер на одном из сайтов, укажите операционную систему Linux Ubiuntu Server (или Debian). Linux — это семейство операционных систем на одном и том же ядре Linux . У каждого Линукса есть свой дистрибутив — это стандартные комадны (если по-простому). Ubuntu Server и Debian  — самый популярные и простые в использовании дистрибутивы. Разницы между ними почти нет, потому что Ubuntu Server построен на Debian. Debian более стабильный, а Ubuntu server чаще обновляется.

После создания сервера, вы получите адрес сервера (по виду 11.22.33.44), логин (либо стандартный логин «root») и пароль.

Зайдите на сервер:

Откройте терминал и зайдите на сервер

ssh root@111.222.333.444 # ваш сервер

Нажмите Enter. Введите пароль. Нажмите Enter.

Далее, возможно, будет установка линукса. Обычно, нужно просто подтвердить, что готовы установить линукс и всё. Напишите ChatGPT при вопросах.

После установки, обновите систему

sudo apt-get update
sudo apt-get upgrade

установите Python

sudo apt update
sudo apt install python3
sudo apt install python3-pip

установите библиотеки

pip3 install pyrogram
pip3 install python-dateutil

Скачайте папку с кодом через git.

git clone https://github.com/Koveh/Telegram.git

Откройте папку

Cd HappyBirthdays

Отредактируйте код:
Код можно редактировать в программе Nano

sudo apt install nano

nano name_of_python_file.py

Введите ваш api_id и api_hash, Они находятся на сайте телеграмма в разделе API development tools. Откройте любой питон файл и введите данные в api_id = ’’ и api_hash = ’’. Поместите ваш id и hash внутри кавычек.

сохраните файл и выйдите из nano.

Запустите программу

python your_script.py

При первом запуске, укажите ваш номер телефона в командной строке, когда программа это потребует. телеграмм отправит вам код аутентиификации. Оправит в приложении телеграмма. Введите код из 5 цифр в командную строку и нажмите enter.

Сделайте программу вечной

проверьте, что с кодом всё хорошо

chmod +x your_script.py

Программа nohup (установленно по умолчанию) запускает код, который будет работать на заднем плане.

nohup python3 your_script.py &

Чтобы выключить программу, найтите ID процесса, это вторая колонка.

ps -ef | grep your_script.py
kill process_id

Я очень хочу сделать этот проект доступным каждому без знания кода, но это сложно. Для работы бота нужно ввести код подтверждения, и хранить данные о многих пользователях в одном месте. Если хотите, чтобы я это сделал, поделитесь с друзьями этим проектом и напишите комментарий.

Финансовая Аналитика в Телеграмме

Я создал финансовую панель @financial_data_bot. Использование бесплатное.

Получение данных акций

/info msft y ma30

/info — команда, активирующая функцию получения данных акций.

msft — тикер Microsoft. Можно вставить любой другой. Пока не все тикеры доступны.

y — временной диапазон. Можно использовать w, m, 3m, 6m, y, 3y или 5y. Также можно ввести конкретные даты, например, 01-2021 03-2023 показывает данные с января 2021 года по март 2023 года.

ma30 — месячная средняя линия. Рассчитывает среднюю стоимость акции за последние 30 дней. Можно использовать любое количество дней: ma40 ma60 ma120 и т. д.

Можно выводить более одной линии, добавив еще одну ma30 /info msft y ma60 ma80 ma240.

Данные рынка страны

/market USA 1y

Получите данные рынка с наиболее популярными показателями, такими как государственный долг, инфляция, баланс торговли, безработица и т. д.

Ответы на вопросы по финансам

/ask что такое cds?

Ответ:
CDS (Credit Default Swap) — это финансовый дериватив, используемый для защиты от дефолта или неплатежеспособности заемщика.

CDS представляет собой контракт между двумя сторонами, обычно инвесторами или банками. Владелец CDS платит регулярные премии продавцу CDS в обмен на обязательство последнего возместить убытки, если заемщик дефолтирует по своим обязательствам.

Если заемщик действительно неплатежеспособен, владелец CDS получает компенсацию от продавца CDS, чтобы покрыть свои потери. Однако, если заемщик продолжает выплачивать свои обязательства, владелец CDS не получает никакой компенсации, а только утрачивает свои премии.

Спрашивайте о чем угодно: о формулах, теориях, инструментах, исторических событиях, личностях. Помощник так же посчитает любую задачу и объяснит как он посчитал.

Сигналы о цене (скоро)

/alert msft 9:00 12:00 18:00

alert выводит цену в определенное время каждый день, кроме выходных.

/alert currency 9:00 — выводит курсы eurrub и usdrub
/alert brent 9:00 — выводит цену на нефть Brent

/stop msft — чтобы остановить сигнал для определенной акции.

Получение сводки новостей (скоро)

Для получения сводки использую Openai chatgpt. Это платно — каждый дневный анализ новостей акций стоит 50 центов. Бот анализирует миллион слов в сотнях газет. Если нужна эта функция, получите Openai API и введите его в /openai Your_API_Key, например, /openai sk-jfkafjkwhlfhph82p9hi3u2hrbguashg98g3.

Бот будет хранить сводку в базе данных и делиться анализом новостей с другими

/summary msft d

d — день. Может быть неделей (w) или месяцем (m). Также можно выбрать конкретную дату, например, /summary msft 01-02-2023 03-02-2023.

/summary d — получает сводку новостей общего рынка США.

Дополнительные данные с помощью API (скоро)

Хочу, чтобы бот был бесплатным, но у меня есть ограничения на использование определенных данных. Например, можно сделать только 2 запроса о ценах на USD и EUR в минуту. Анализ новостей акций тоже дорогой.

Получите эти 3 API, чтобы использовать бота бесплатно:

  • Alpha vantage — предоставляет курсы валют, бесплатно при использовании менее 5 запросов в минуту
  • Fred — американская база данных рыночных данных. Требуется регистрация на 2 минуты
  • Openai — машина Ghatgpt. Зарегистрируйтесь и получите 5$ бесплатно. Получите API.

Больше возможностей

Хочу получать котировки акций, облигаций и валют в реальном времени. Это стоит немного. Например, чтобы купить информацию на Московской Бирже, нужно заплатить 100$ в месяц за каждый тип ценной бумаги. Сам не потяну, но если будет достаточно пользователей, создам подписку за 1$, которая предоставит все возможности.

Также плачу 4$ за сервер, который обрабатывает 15 запросов в минуту. За каждые дополнительные 20 запросов в минуту в месяц придется заплатить 2$. База данных стоит 5$ за 15 ГБ. Если вам нравится бот, можете помочь мне его финансировать через Koveh Pay

Некоторые ошибки с графиками будут исправлены в ближайшее время.

Если у вас есть идеи, вы нашли ошибку, хотите продвигать проект или присоединиться к команде, напишите комментарий ниже или на daniil@koveh.com

DIY: Summarise Your Speech

I like discussing ideas out loud. I record my thoughts using Voice Memos on my iPhone. I talk for hours but never listen to my records, because it gets boring.

We will make an app, that transforms audio into text. And then, we will make a structured summary. And even a Business Model Canvas of an idea.

Plan

  1. Install Openai Library
  2. Audio to Text
  3. Audio to Summary
  4. Audio to Business Model Canvas
  5. Draw a Business Model Canvas Automatically

Requirements

You need Python and Openai account.

if you don’t have Python or don’t know how to work with libraries on Python, take a look at my previous tutorial about object detection in images, where we installed it on Mac and Windows.

If you have some errors or don’t understand something, ask chatGPT.

Install OpenAI Library

Open «Terminal» on Mac or in Visual Studio Code. type the following:

pip install openai

The library is used for 3 purposes: ask ChatGPT, translate speech to text, and generate an image. We use ChatGPT and Speech-to-Text functions.

Get the API key

Openai is not free to use. We should pay 0.006$ per each minute of audio. Therefore, we need to register on the Openai website and get the API key, that we insert later in the code. Openai also gives 5$ to the new users.

get the API key after registration.

Record your voice

Use the «Voice Memos» app on Mac or iPhone or any other recording app. Most of the audio file formats are supported by Whisper AI from OpenAI.

Speak for up to 10 minutes in English. Next, move the recording file to the same directory where you will store the Python file. You may also copy the path to the audio file instead of moving it.

Audio to Text

import openai

# insert your API key
openai.api_key = "sk-tIBD5UTbJ9RdqrwjP2dNT3BlfkFJzex4WGqvNsi3uAdMdC1V"

# Define the path to the file. if the file is in the same folder as the Python code, just write the name of a file
path = "audio.m4a"
audio_file= open(path, "rb")

# Select the AI to use (whisper-1 is the newest in April 2023)
transcript = openai.Audio.transcribe("whisper-1", audio_file)

print(transcript.text)

We have translated our speech into text.

Audio to Summary

We use ChatGPT-3 to make a summary. You may use gpt-3.5 that costs 10 times less or gpt-4 for a more precise summary of more than 4000 words.

The maximum amount of words is 4096. The token is a way how the AI stores the data. for English, each token represents nearly one word (700 words are nearly 1000 tokens). For Russian, German, and French — each token is nearly one letter (700 words are nearly 5000 tokens). Translate the text to English and only then use chatGPT. You will save 5x dollars.

In Prompt we add the translated text and the task that we want an AI to do.

# save the translated text as text
text = transcript.text

prompt = (
        f"Make the summary of the text: \n\n{text}\n\n"
    )

response = openai.Completion.create(
    model="text-davinci-003", 
    prompt=prompt,
    max_tokens=3900 # 4096 minus the constant prompt message
    n=1,
    stop=None,
    temperature=0.5,
)

print(response.choices[0].text.strip())

combine this code with the previous one and run the script. That’s it.

Audio to Business Model Canvas

If I talk about founding a business, why not combine the text in a business model canvas.

prompt = (
    f"Create a business model canvas based on the idea explained below:\n\n{text}\n\n"
    "Use the following structure of 9 blocks:\n"
    "Customer Segments:\n"
    "Value Propositions:\n"
    "Channels:\n"
    "Customer Relationships:\n"
    "Revenue Streams:\n"
    "Key Resources:\n"
    "Key Activities:\n"
    "Key Partners:\n"
    "Cost Structure:"
)

You get the structured answer, and you can insert the data in your business model canvas template.

Draw business model canvas

Let’s make a real business model canvas out of the idea described in the audio. We need to do a simple website with CSS, HTML, JSON, and Python. I prepared it for you:
Download the folder

Install Flask library

pip install flask

Run text_to_bmc.py, audio_to_bmc.py, or bmc_web.py (if you don’t have openai account) within the given folder. Don’t forget to write Openai API key and the audio or text:

Open in the browser: http://127.0.0.1:5000. Or any other page that is written in your terminal

you may also run audio_to_bmc.py or text_to_bmc.py, where the full code is written, just edit the API key and that’s it.

That’s it. You don’t need any longer to think about how to structure the business model canvas.

Challenge

Create the House of Quality model, that tells the difference between you and competitors.

Create the business plan template, which is created automatically based on your recording — add the SWOT, PESTEL analysis, intro about the product, executive summary, team structure, and maybe competitor and market analysis, using the knowledge from my «DIY» articles.

Share the tutorial with your friends and colleagues. If you want to see how to record one hour of a speech or team meeting, and how to record in any language and cheaply, then leave a comment. Meanwhile, read other DIY articles, you can find them, by simply typing «DIY» in the search on the top right. Also, check out the articles about finances and urban planning.

If you want to use a similar app casually, subscribe to my Telegram bot. @Chat_Zaichat_bot can listen for up to 10 minutes of speech and transform it into text and summarise everything you said. It costs just 20 cents per 10 minutes of speech. The money is spent on Openai libraries and server maintenance.

Ранее Ctrl + ↓