Для работы функции нужно указать токен от https://apiframe.pro/
Пример вызова функции:
"api: XXXXXXXXXXXXXXXXXXXXXX нарисуй мне голубоглазую девушку в стиле фотореализм в формате 4:7"
"api: XXXXXXXXXXXXXXXXXXXXXX нарисуй мне голубоглазую девушку в стиле фотореализм в формате 4:7"
💡Токен можно прописать внутри инструкций вашего бота и тогда будет достаточно только запроса на генерацию картинки. https://documenter.getpostman.com/view/33976547/2sA35HXgaH
{
"name": "handwriting_recognition",
"description": "Распознавание рукописного текста",
"parameters": {
"type": "object",
"properties": {
"file_url": {
"type": "string",
"description": "Ссылка файл (URL файла) или изображение (URL фото) с рукописным текстом. Формат файла в ссылке не важен.",
},
},
"required": ["file_url"],
},
},
Распознавание MP3
Функция получает ссылку на MP3 файл и с помощью методов асинхронного распознавания Яндекса возвращает текстовый файл с результатом.
Если ты получишь ссылку на файл .mp3, то сразу вызови функцию распознования с параметрами:
{
'languageCode' : '',
'model' : 'general',
'profanityFilter' : False,
'literature_text' : False,
'audioEncoding' : 'MP3',
'audioChannelCount' : 1,
'rawResults' : False,
}
bucket_name = 'protalkstt'
{
"name": "yandex_transcribe_audio",
"description": "Отправить аудиофайл на распознавание речи",
"parameters": {
"type": "object",
"properties": {
"audioURL": {
"type": "string",
"description": "URL аудиофайла",
},
"languageCode": {
"type": "string",
"description": "Код языка, по умолчанию `ru-RU`",
},
"audio_model": {
"type": "string",
"description": "Модель распознавания, по умолчанию `general`",
"enum": ["general"],
},
"profanityFilter": {
"type": "boolean",
"description": "Фильтр ненормативной лексики, по умолчанию `False`",
},
"literature_text": {
"type": "boolean",
"description": "Включает режим нормализации, по умолчанию `False`",
},
"audioEncoding": {
"type": "string",
"description": "Формат аудиофайла, по умолчанию `MP3`",
"enum": ["LINEAR16_PCM", "OGG_OPUS", "MP3"],
},
"sampleRateHertz": {
"type": "integer",
"enum": [48000, 16000, 8000],
"description": "Частота дискретизации аудио. Этот параметр обязателен, если значение format равно LINEAR16_PCM.",
},
"audioChannelCount": {
"type": "integer",
"description": "Количество аудиоканалов, по умолчанию равно 1",
},
},
"required": ["audioURL", "languageCode", "audio_model", "profanityFilter", "literature_text", "audioEncoding", "audioChannelCount"],
},
},
Распознавание изображения OpenAI GPT-4-omni
Распознавание изображения OpenAI GPT-4-omni
{
"name": "image_recognition",
"description": "Распознавание изображения",
"parameters": {
"type": "object",
"properties": {
"file_url": {
"type": "string",
"description": "Ссылка файл (URL файла) или изображение (URL фото). Формат файла в ссылке не важен.",
},
"question": {
"type": "string",
"description": "Формулировка задачи по распознованию изображения",
},
},
"required": ["file_url", "question"],
},
},
Задать вопрос к видео на YouTube
Задать вопрос к видео на YouTube
{
"name": "question_youtube_video",
"description": "Отправляет вопрос к видео на YouTube и получает ответ",
"parameters": {
"type": "object",
"properties": {
"openai_api_key": {
"type": "string",
"description": "API ключ OpenAI",
},
"model": {
"type": "string",
"description": "Модель OpenAI для обработки запроса",
"enum": ["gpt-4o-2024-08-06", "gpt-4o-mini"],
},
"video_url": {
"type": "string",
"description": "URL видео на YouTube",
},
"question": {
"type": "string",
"description": "Вопрос к видео",
},
},
"required": ["openai_api_key", "model", "video_url", "question"],
},
},
Создание стикеров для Telegram
Принцип работы:
Изображение конвертируется в формат RGBA.
Цвет фона определяется по первому пикселю (0,0).
Все пиксели, которые совпадают с цветом фона (с учетом заданного коэффициента допуска), становятся прозрачными.
{
"name": "convert_image_to_sticker",
"description": "Создание стикера из картинки JPG или PNG",
"parameters": {
"type": "object",
"properties": {
"image_url": {
"type": "string",
"description": "URL изображения",
},
"tolerance": {
"type": "integer",
"description": "Коэффициент допуска для определения прозрачности пикселей. По умолчанию равен 30.",
},
},
"required": ["image_url", "tolerance"],
},
},
Создания 3D аватара от HedraAI
Функция generate_talking_character предназначена для создания говорящего персонажа на основе изображения и текста.
{
"name": "hedra_generate_talking_character",
"description": "Generate a talking character from an image and text",
"parameters": {
"type": "object",
"properties": {
"image_url": {
"type": "string",
"description": "URL of the image for the character",
},
"text": {
"type": "string",
"description": "Text for the character to speak",
},
"api_key": {
"type": "string",
"description": "API key for authentication",
},
"voice_id": {
"type": "string",
"description": "Voice ID for the character. Male default: `Mg1264PmwVoIedxsF9nu`. Female default: `LcfcDJNUP1GQjkzn1xUU`",
},
},
"required": ["image_url", "text", "api_key", "voice_id"],
},
},