Week_1 cpu (Shlyapnikov A.) by usernaimandrey · Pull Request #151 · hardcode-dev/rails-optimization-task1

usernaimandrey · 2025-01-26T21:46:38Z

No description provided.

spajic

👍 nice work!

spajic · 2025-01-28T20:25:39Z

Makefile

+	gzip -dk fixtures/data_large.txt.gz
+
+prepare_data:
+	head -n 1000 fixtures/data_large.txt > fixtures/data1000.txt


лайк за makefile!

spajic · 2025-01-28T20:26:01Z

Makefile

+
+prepare_data:
+	head -n 1000 fixtures/data_large.txt > fixtures/data1000.txt
+	head -n 2000 fixtures/data_large.txt > fixtures/data2000.txt


fixtures лучше бы в gitignore добавить, чтобы не было 300к строк в PRе

spajic · 2025-01-28T20:28:08Z

case-study-template.md

 ## Формирование метрики
-Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику: *тут ваша метрика*
+Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику:
+- обрабатывать 200_000 строк не больше чем за 1,5 сек, если я уложусь в это время, то обработка всего файла уложится в бюджет


в таких кейсах хорошо бы добавить чуть логики и арифметики - каким соотношением руководствуемся, какие числа и как получаем такой результат

Наверное как то так?
Целевая метрика - мы хотим что бы полной отчет формировался(3250940) не более чем за 30 сек?

spajic · 2025-01-28T20:29:05Z

case-study-template.md

+"Processing time from file 1000000 rows: 41.2784" // полный отчет
+```
+
+Асимптотика финальная - видно что она почти линейная


ну она в принципе после первой итерации почти сразу и превращается в линейную

spajic · 2025-01-28T20:30:04Z

case-study-template.md


 ## Feedback-Loop
-Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за *время, которое у вас получилось*
+Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за 5 минут(внес изменеия -> запустил бенчмарк и профилировщик-> посмотрел результат)


spajic · 2025-01-28T20:33:05Z

case-study-template.md

+Удалось улучшить метрику системы с *9,36 до 1.3274* и уложиться в заданный бюджет(полный отчет формируется за 29.8777).

 *Какими ещё результами можете поделиться*
+1. Пробовал запускать коллектинг данных по пользователям в несколько тредов(на кажый вызов `collect_stats_from_users(report, users_objects) do |user|` отдельный тред) - в моем случае это привело к регресу производительности с 37 сек. до 60


с concurrency ещё будем разбираться в курсе

в целом в Ruby два треда не могут что-то считать одновременно; поэтому если задача именно в том чтобы что-то считать (а не ждать IO), то добавление треда не поможет, а скорее сделает хуже - как и произошло

но здорово, что проверили

spajic · 2025-01-28T20:33:42Z

lib/task-1.rb

+  file_lines_count = file_lines.count
+
+  users_storage = {}
+  unique_browsers = Set[]


spajic · 2025-01-28T20:34:53Z

lib/task-1.rb

+
+  # Даты сессий через запятую в обратном порядке в формате iso8601
+  collect_stats_from_users(report, users_objects) do |user|
+    { 'dates' => user.sessions.map{|s| s[:date]}.map {|d| Date.parse(d)}.sort.reverse.map { |d| d.iso8601 } }


тут есть пасхалочка, что дата изначально в нормальном формате, поэтому с ней можно ничего не делать

Спасибо! Слона то и не заметил, плюс ко всему это довольно замедляет программу.
Попробовал убрать и сразу - 8 сек на больших данных, было 29 стало 21

spajic · 2025-01-28T20:36:01Z

lib/utils/progress_bar_factory.rb

@@ -0,0 +1,26 @@
+require 'ruby-progressbar'
+
+class ProgressBarFactory


spajic · 2025-01-28T20:37:59Z

tests/task_perform_spec.rb

+  let(:time) { 1.5 }
+  let(:paths) { ['fixtures/data1000.txt', 'fixtures/data2000.txt', 'fixtures/data4000.txt', 'fixtures/data8000.txt'] }
+
+  shared_examples 'when create report' do


чот как-то сложно, мб без shared examples просто

it 'creates the report in expected time' do ... end

Ага поправил!

init

262591d

spajic approved these changes Jan 28, 2025

View reviewed changes

Шляпников Андрей Николаевич added 3 commits January 29, 2025 09:05

add fixtures to gitignore

0b514a0

remove data_large

9743ff6

fix performance tests

34de58a

		@@ -0,0 +1,26 @@
		require 'ruby-progressbar'

		class ProgressBarFactory

Conversation

usernaimandrey commented Jan 26, 2025

Uh oh!

spajic left a comment

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants