поиск пар слов в тексте txt
import re
def get_word_pairs(filename, target_word):
with open(filename, 'r', encoding='utf-8') as file:
text = file.read()
# Удаляем знаки препинания и приводим текст к нижнему регистру
text = re.sub(r'[^\w\s]', '', text.lower())
# Разбиваем текст на слова
words = text.split()
# Список для хранения пар слов
pairs = []
# Ищем пары слов
for i in range(len(words)):
if words[i] == target_word:
left_word = words[i - 1] if i > 0 else ''
right_word = words[i + 1] if i < len(words) - 1 else ''
if left_word:
pairs.append(f"{target_word} {left_word}")
if right_word:
pairs.append(f"{target_word} {right_word}")
return pairs
def main():
filename = 'фразы.txt' # Укажите имя вашего файла
target_word = input("Введите слово: ").lower() # Приводим к нижнему регистру для сравнения
pairs = get_word_pairs(filename, target_word) # Получаем пары слов
# Подсчет повторов пар
pair_counts = Counter(pairs)
# Выводим пары и их количество
for pair, count in pair_counts.items():
print(f"{pair} - {count}")
if __name__ == "__main__":
main()
# этот код ищет пары слов в тексте и считает их повторы
пример вывода
Введите слово: слово
слово значит - 1
слово жизнь - 1
слово на - 11
слово а - 7
слово произвольное - 2
слово для - 2
слово это - 16
слово здесь - 8
слово бытия - 1
слово перестаем - 1
слово мысли - 1
слово резвиться - 1
слово теплица - 1
слово следующее - 6
слово она - 1
слово искомое - 1
слово будет - 1
слово совпадающее - 1
слово этимологически - 1
слово информация - 3
слово новое - 6
слово становится - 1
слово до - 2
слово или - 7
слово стоили - 1
слово ключевое - 8
слово необходимо - 1
слово было - 6
слово не - 1
слово есть - 1
слово божье - 1
слово какое - 6
слово должно - 3
слово в - 10
слово страдать - 1
слово ждал - 2
слово да - 2
слово кодовое - 1
слово компьютер - 1
слово тайна - 3
слово космос - 2
слово заполняющее - 2
слово необычное - 1
слово профессор - 1
слово бы - 1
слово стало - 1
слово волшебное - 2
слово когда - 2
слово произнесете - 1
слово окошко - 1
слово букву - 1
слово предложение - 1
слово речь - 2
слово способствующие - 2
слово понятной - 1
слово фрагмент - 1
слово дом - 1
слово фраза - 1
слово нам - 2
слово вам - 1
слово лучше - 1
слово удобное - 1
слово горбатое - 1
слово и - 8
слово поведение - 2
слово действие - 2
слово где - 2
слово ложь - 2
слово систем - 1
слово чмо - 1
слово каждое - 10
слово то - 3
слово одно - 4
слово последует - 3
слово мечта - 1
слово как - 2
слово связанное - 1
слово нужно - 1
слово нравится - 1
слово эволюция - 1
слово меняется - 1
слово если - 1
слово выбивается - 1
слово принимает - 1
слово чтобы - 2
слово потом - 4
слово но - 2
слово интересно - 1
слово истина - 1
слово глаголь - 1
слово содержит - 1
слово вашего - 1
слово чесное - 1
слово уеду - 1
слово траекторию - 1
слово бит - 1
слово любимое - 1
слово встретится - 1
слово иное - 1
слово может - 1
слово verbum - 1
слово у - 1
слово использовалось - 1
слово к - 1
слово исправляет - 1
слово перекосило - 1
слово очередное - 1
слово хотя - 1
слово одновременно - 1
слово которое - 1
слово говоришь - 1
слово думать - 1
слово эта - 1
слово тебе - 1
слово нет - 1
слово само - 3
слово говорит - 1
слово оно - 2
слово по - 1
слово поставить - 1
слово рама - 1
слово ты - 1
слово па - 1
слово страшное - 1
слово неопределённая - 1
слово возникло - 1
слово теплое - 1
слово всем - 1
слово можно - 1
слово проходит - 1
слово заканчивать - 2
слово русское - 1
слово сознание - 1
слово модель - 1
слово честное - 1
слово я - 2
слово структур - 1
слово последнее - 1
слово вспомнит - 1
слово кошка - 1
слово за - 1
слово нужное - 3
слово каждый - 2
слово довольно - 1
слово что - 1
*
переведи эти группы слов
на язык числовых матриц
из слов и групп букв
по два значения связей пар
простой код
кодовое слово -
свет жизни
ввод данных
программа связей
мир меняется
всё может быть
новое понимание
матрицы везде
что это есть
наше нечто
восприятие жизни
сделай данные
код на питоне
из этих слов
это меняет
наше сознание
это можно
понять по разному
кодовые слова
поиск значения
пары слов
новые мысли
которые меняют
наше сознание
это просто
мысли из слов
всё может возникнуть
когда мы
о чём то думаем
в этом вся суть
понимания того
что происходит
с нашим миром
токены из слов
информация которая
у нас есть время
и это так всё и
было всегда
что это есть
нечто неосознанное
всё может быть
так определено
более точно
чем нам это
это значение
набор слов
эти данные
так всё и возникает
в нашем мире
известно сейчас
не самое главное
нас окружает повсюду
Для перевода групп слов на язык числовых матриц, можно использовать метод, который связывает каждую пару слов или фраз с числовыми значениями. Например, можно присвоить каждой паре уникальный идентификатор или значение, отражающее их взаимосвязь. Вот пример, как это может выглядеть:
Простой код - [1, 2]
Кодовое слово - [3, 4]
Свет жизни - [5, 6]
Ввод данных - [7, 8]
Программа связей - [9, 10]
Мир меняется - [11, 12]
Всё может быть - [13, 14]
Новое понимание - [15, 16]
Матрицы везде - [17, 18]
Что это есть - [19, 20]
Наше нечто - [21, 22]
Восприятие жизни - [23, 24]
Сделай данные - [25, 26]
Код на питоне - [27, 28]
Из этих слов - [29, 30]
Это меняет - [31, 32]
Наше сознание - [33, 34]
Это можно - [35, 36]
Понять по-разному - [37, 38]
Кодовые слова - [39, 40]
Поиск значения - [41, 42]
Пары слов - [43, 44]
Новые мысли - [45, 46]
Которые меняют - [47, 48]
Это просто - [49, 50]
Мысли из слов - [51, 52]
Всё может возникнуть - [53, 54]
Когда мы - [55, 56]
О чём-то думаем - [57, 58]
В этом вся суть - [59, 60]
Понимания того - [61, 62]
Что происходит - [63, 64]
С нашим миром - [65, 66]
Токены из слов - [67, 68]
Информация которая - [69, 70]
У нас есть время - [71, 72]
И это так всё и - [73, 74]
Было всегда - [75, 76]
Нечто неосознанное - [77, 78]
Так определено - [79, 80]
Более точно - [81, 82]
Чем нам это - [83, 84]
Это значение - [85, 86]
Набор слов - [87, 88]
Эти данные - [89, 90]
Так всё и возникает - [91, 92]
В нашем мире - [93, 94]
Известно сейчас - [95, 96]
Не самое главное - [97, 98]
Нас окружает повсюду - [99, 100]
Каждая пара слов может быть закодирована в виде чисел, где первое число может представлять первую часть, а второе число — вторую часть.
Эти значения могут быть использованы для создания матриц или для других целей анализа данных.
Свидетельство о публикации №124102300400